python - Pyspark - dataframe..write - AttributeError:'NoneType'对象没有属性'mode'
问题描述
我正在尝试使用 pyspark 将 csv 文件转换为镶木地板。
parquet_file = s3://bucket-name/prefix/
parquet_df.write.format("parquet").option("compression", "gzip").save(parquet_file).mode(SaveMode.Overwrite)
我正在尝试覆盖镶木地板文件,但出现以下错误。能否请你帮忙。
发生错误 - 'NoneType' 对象没有属性 'mode'
回溯(最后一次调用):文件“/tmp/ma-test-csv-to-parquet-glue-job-2”,第 173 行,结果 = write_to_parquet(nn_df1) 文件“/tmp/ma-test-csv -to-parquet-glue-job-2",第 147 行,在 write_to_parquet parquet_df.write.format("parquet").option("compression", "gzip").save(parquet_file).mode(SaveMode.Overwrite) AttributeError:“NoneType”对象没有属性“模式”
解决方案
写入模式应指定为DataFrameWriter
not after save
(不返回任何“None”,因此返回错误消息):
parquet_df.write.mode(SaveMode.Overwrite).format("parquet").option("compression","gzip").save(parquet_file)
推荐阅读
- java - MILO:什么时候使用UaSubscription,什么时候使用ManagedSubscription,有什么区别?
- c++ - 循环的 C++ 链表
- mongodb - “brew services restart mongodb-community”在 brew services 列表下抛出错误状态。这是什么错误?
- git - 如何在 PyCharm Pro 中使用新的更改更新拉取请求?
- file - 文件名中“通用”的含义
- delphi - 如何将文件名从程序的第二个实例传递到主实例?
- java - Spring Boot 将 camelCase 字符串转换为 Enum
- kubernetes-helm - 等待 helm delete 再继续?
- sql-server - 将集成运行时连接到 azure 数据工厂和权限
- css - 悬停效果闪烁的 CSS 动画,在 FF 中未正确显示