首页 > 解决方案 > 如果 Table 中已存在内容,请避免在 Bigquery 中重新加载数据

问题描述

我正在写一个气流管道。我需要编写 dag,以便将 csv 文件的内容加载到 Bigquery Table,但如果内容已经存在于表中,它会丢弃该文件。我知道我们可以在正常编程中通过计算文件的哈希来做到这一点,但不知道如何使用 Airflow 和 Bigquery。有谁知道该怎么做?

标签: google-bigqueryairflowetl

解决方案



推荐阅读