python - Python 用 Panda 解析 csv 中的字符串值
问题描述
我是 Python 新手,我正在尝试使用 pandas 读取 csv 文件,但我的 csv 文件中有一些问题。我的字符串末尾包含逗号,这会在末尾创建一个不需要的列,如图所示:
这是原始的csv:
例如,在 line 上14
,绿色字符串值以逗号结尾并创建一个新列,然后在使用此列时会出现解析错误:
import pandas as pd
pd.read_csv("data.csv")
ParserError:错误标记数据。C 错误:预计第 8 行中有 6 个字段,看到 7
有没有办法可以清理它并合并最后两列?
解决方案
您可以使用np.where
缺少 APP 的最后一列替换 APP,然后删除最后一列。
import pandas as pd
import numpy as np
df = pd.read_csv("data.csv")
df['APP'] = np.where(df.app.isna(), df[-1], df.APP)
df = df.iloc[:,:-1]
推荐阅读
- c++ - 从命令行构建 Eclipse Makefile 项目
- javascript - SVG 不在 IOS 上渲染(渲染空白空间)
- ruby-on-rails - 如何显示属于某个诊断的所有病例?
- node.js - AWS Lambda - NodeJS CSV 数据到 S3 文件
- python - 为什么调用函数有效但断言函数会导致断言错误?
- ios - Flutter 应用程序在更新 Flutter 后无法启动
- php - if then 嵌套语句导致页面无法加载
- javascript - 这个javascript语法是否正确?Node,js 抛出语法错误
- char - 如何在 C++ 中将 double 变量转换为 char 数组?
- core-data - 修改 CoreData 时如何在 SwiftUI 中更新 TabView?