首页 > 解决方案 > 自定义函数中复杂逻辑的 BigQuery 成本

问题描述

我在这样定义的自定义函数中使用了相对昂贵的计算:

CREATE TEMP FUNCTION HMAC256(message STRING, secret STRING)
  RETURNS STRING
  LANGUAGE js
  OPTIONS (
    -- copy this Forge library file to Storage:
    -- https://cdn.jsdelivr.net/npm/node-forge@0.7.0/dist/forge.min.js
    -- @see https://github.com/digitalbazaar/forge
    library=["gs://.../forge.min.js"]
  )
  AS
"""
  var hmac = forge.hmac.create();
  hmac.start('sha256', secret);
  hmac.update(message);
  return hmac.digest().toHex();
""";


SELECT HMAC256("test", "111");

-- Row  f0_
-- 1    f8320c4eded4b06e99c1a884a25c80b2c88860e13b64df1eb6f0d3191023482b

LOWER例如,与应用功能相比,这会更昂贵吗?

HMAC256在我的数据集上花费 4 分钟,而在LOWER.

如果价格相同,那就太棒了。我有一种感觉,我错过了什么。

标签: google-bigquerycost-management

解决方案


是的。费用将是相同的。对于 BigQuery,您的查询可能会变得更复杂和更昂贵,但您只需按相同的费率收取费用,直到您的查询达到限制。如果您没有预订(又名统一费率插槽),您的禁区查询将失败。

第 100 层下的所有高计算查询均按第 1 层计费。

除非查询在保留实例中运行,否则 100 层以上的所有查询都将失败并出现 RESOURCES_EXCEEDED_PER_BYTE 错误。


推荐阅读