python - 使用 csv 文件创建增量表
问题描述
我正在尝试在数据块中创建增量表。我使用此链接作为学习的参考。这里提到对于所有文件类型,我需要将文件读入 DataFrame 并以 delta 格式写出:。所以我在python中编写了以下代码
import pandas as pd
df=pd.read_csv('my file path/data.csv')
df.write.format("delta").save("/mnt/delta/df")
spark.sql("CREATE TABLE df USING DELTA LOCATION '/mnt/delta/df/'")
但我收到了错误信息
'DataFrame' object has no attribute 'write'
你能帮我解决这个问题吗?
解决方案
希望这会有所帮助
myCSV= spark.read.csv("/path/to/input/data",header=True,sep=",");
myCSV.write.format("delta").mode("overwrite").option('overwriteSchema','true').save("/mnt/delta/Employee")
spark.sql("CREATE TABLE employee USING DELTA LOCATION '/mnt/delta/Employee/'")
推荐阅读
- vba - 如何在跟踪单个单元格的更改时允许多个单元格选择
- swift - 如何使用 swift 在 Heroku 应用上上传图片
- java - 如何在我的 ButtonActionPerformed 中调用此方法
- c# - 折线仅绘制 2 条线和 Point.Parse 问题
- php - 验证请求视频文件 (Laravel)
- r - 将一个数据帧中的单元格值与另一数据帧中的相应单元格值连接起来
- javascript - 如果 id 与值在同一个数组中,如何在 JSON 块中找到值?
- django - React Redux 简单的 GET Api 调用
- postgresql - Postgres 执行计划图片
- android - 向数据库中插入数据时如何将数据插入到表的前面?