python - 将 csv 文件作为数据框读取时模式错误
问题描述
试图将 csv 文件读入数据框简单代码
df = spark.read.csv("1.csv")
我有
df.printSchema()
root
|-- _c0: string (nullable = true)
我也试试这个
db = spark.read.csv("1.csv", header=True, inferSchema= "True")
db.printSchema()
root
|-- id | date | cases | country | deaths | cities | per_cap |
在此先感谢您的帮助
解决方案
显然,您的行分隔符是 pipe |
。
尝试:
db = spark.read.csv("1.csv", sep='|', header=True, inferSchema= "True")
for col in db.columns:
db = db.withColumnRenamed(col, col.strip())
推荐阅读
- javascript - 错误@wdio/local-runner:启动测试会话失败:错误:在 DevToolsDriver.getPageHandle 找不到页面句柄
- java - java中的类对象是否可以具有值,如果可以,我们如何获取它?
- ethereum - 如何预先为安全帽本地节点地址提供资金
- visual-studio-code - 如何在 Visual Studio 代码回收站 Windows 中恢复已删除的文件夹
- python - 来自 3D 数据的热图,带有浮点数
- gekko - 如何制定在 gekko 中寻找最佳 PID 参数的问题?
- java - 如何只让编辑文本接受 Textview 中的字母
- apache-flink - Apache Flink RocksDB 状态管理
- pandas - 如何将 counter 和 most_common 应用于每行的数据框列
- r - 有没有办法让我的柱状图中的数字出现在我的直方图中?