首页 > 解决方案 > 如何读取具有列表的数据集

问题描述

在我正在处理的数据集中,一些列包含字典列表

以下是描述电影类型的列示例

在此处输入图像描述

问题是当我使用pd.read_csv()此列数据类型时,它将是字符串而不是列表,这使得数据预处理更加困难。

我如何将这些列读取为列表而不是字符串?

标签: pythonpandascsvdataframedata-science

解决方案


使用参数“转换器”来决定函数“pd.read_csv”中特殊列的类型。就像是:

df = pd.read_csv('filename.csv', converters={'Code':str})

它将强制将“代码”列读取为字符串类型。也许它会对你有所帮助,但我只是有关于从“float”到“str”的类型转换的经验,所以我不能保证它有效。


推荐阅读