apache-spark - 从 Dataproc 写入 BigQuery 表时出错 - Spark
问题描述
我正在尝试将数据从 Dataproc - Spark 插入到 Big Query 表中。我正在使用以下代码:
df.write \
.format("bigquery") \
.option("temporaryGcsBucket","bucket/temp") \
.save("project.datasource.table1")
错误:
pyspark.sql.utils.IllegalArgumentException: 'SaveMode 设置为 ErrorIfExists 并且表 project.datasource.table1 已经存在。您是否想通过将 SaveMode 设置为 Append 来将数据添加到表中?示例:df.write.format.options.mode(SaveMode.Append).save()'
我插入了“.mode(SaveMode.Append)”,但它没有用。
解决方案
那会做:
df.write \
.format("bigquery") \
.option("temporaryGcsBucket","bucket/temp") \
.mode("append") \
.save("gcp-bankier.sof.table1")
推荐阅读
- javascript - 在版本 6.1.8 中单击按钮时,Revolution 滑块如何再次启动(播放)?
- powershell - 将结果输出到文件
- jestjs - 开玩笑无法读取 null 的属性“createEvent”
- terminal - 终端卡住加载 GatsbyJS “Hello-World” 入门网站
- networking - az login 返回错误“无法建立新连接:[Errno -3] 名称解析临时失败”
- python - 检查DataFrame中的第n个值是否等于字符串中的第n个字符
- angular - 角度9一一显示对象的值数组
- elasticsearch - 无法在不将数据转发到聚合器的情况下将数据转发到弹性搜索
- java - 测试与多个 LDAP 服务器的连接时出错
- c# - 如何将两个循环重写为一个 LINQ 语句