python - 使用转义字符读取 csv
问题描述
我有一个 csv 文件,其中包含一些文本等。我想标记(拆分成单词列表)这个文本并且在如何pd.read_csv
解释转义字符方面遇到问题。
我的 csv 文件如下所示:
text, number
one line\nother line, 12
代码如下:
df = pd.read_csv('test.csv')
word_tokenize(df.iloc[0,0])
输出是:
['one', 'line\\nother', 'line']
而我想要的是:
['one', 'line', 'other', 'line']
问题pd.read_csv()
不在于将其解释\n
为换行符,而是解释为两个字符(\
和n
)。
我尝试将escapechar
参数设置为'\'
和 ,'\\'
但两者都只是从字符串中删除斜杠而不对换行符进行任何解释,即字符串变为on one linenon other line
.
如果我明确地设置df.iloc[0,0] = 'one line\nother line'
,word_tokenize
工作得很好,因为\n
这次实际上被解释为换行符。
理想情况下,我会简单地改变pd.read_csv()
解释文件的方式,但其他解决方案也可以。
解决方案
你可以简单地试试这个
import pandas as pd
df = pd.read_csv("test.csv", header=None)
df = df.apply(lambda x: x.str.replace('\\', " "))
print(df.iloc[1, 0])
# output: one line other line
推荐阅读
- reactjs - reactjs如何显示图表
- c# - 用于 wpf 应用程序的 Visual c++ 本地部署(cef sharp 需要)
- c++ - 如何反转最后 Y 位并获得正数?
- image - 如何通过单击图像输出 x,y 坐标?
- android - 如何将 react-native 应用程序保持为 LTR(从左到右)
- c++11 - C++11:如何初始化私有静态常量成员?
- wordpress - 当 WordPress WP-Admin 中的插件、工具和设置不可用时,您如何解锁或访问它们?
- openapi - 使用 Quarkus 同步 OpenAPI 和 JSON-B 配置
- objective-c - 如何找到特定的“排列对象”,将 NSArray 转换为 NSValueTransformer?
- machine-learning - scikit-learn的partial_fit方法的含义