csv - 如果列名有逗号作为列分隔符,如何在 pyspark 中将 csv 读入 df?
问题描述
我的 csv 文件有这些列:
'column1', 'column2,structured_well_data' , 'column3', 'column4,distributed_sys_org23454'
等等我读取 csv 文件的代码是这样的:
pandas_config = df_config.toPandas()
for index, row in pandas_config.iterrows():
row["sor_path"] = "/" + row["sor_path"]
df_csv = spark.read.format("delta").load(row["sor_path"], format = "csv", header = "true", inferschema = "true")
df_csv.createOrReplaceTempView("V_" + row["sor_name"])
print("V_" + row["sor_name"] + " has been created..")
我正在做这个:
df_csv = spark.read.format("delta").load(row["sor_path"], format = "csv", header = "true", inferschema = "true")
我尝试添加选项:
df_csv = spark.read.option('delimiter', ',').format("delta").load(row["sor_path"], format = "csv", header = "true", inferschema = "true")
但不工作。
csv 文件如下所示:
如何处理这种情况?
解决方案
推荐阅读
- node.js - 将域设置为 Heroku 应用程序后“无法访问此站点”?
- bash - Makefile:语法错误/bin/sh:-c:语法错误:文件意外结束
- bash - 将关联数组从一个脚本导出到另一个
- javascript - 使用事件委托突出显示表格中的单元格
- sql - SQL查找具有最大日期的项目
- flutter - Flutter StreamController 返回重复数据
- google-apps-script - 无论如何循环浏览Google云端硬盘中特定文件夹中的所有电子表格?
- go - 我想通过将文件名作为用户输入来读取文件
- font-awesome-5 - 自定义 Fontawesome SVG 图标集
- python - 如何修复 Python 中的“无法从 'api' 导入名称 'get_seomoz_data'”错误