首页 > 解决方案 > 如何从python中的CSV列中捕获特定信息

问题描述

我有一个 CSV 文件,其中有一个表格,其中包含我想在另一个表格中引用的信息。为了给您更好的视角,我有以下示例:

"ID","Name","Flavor"
"45fc754d-6a9b-4bde-b7ad-be91ae60f582","account1-test1","m1.medium"
"83dbc739-e436-4c9f-a561-c5b40a3a6da5","account3-test2","m1.tiny"
"ef68fcf3-f624-416d-a59b-bb8f1aa2a769","account1-test3","m1.medium"

我想添加另一列引用名称列并将客户名称拉到一个列中,并将其余信息拉到另一列中,例如:

"ID","Name","Flavor","Customer","Misc"
"45fc754d-6a9b-4bde-b7ad-be91ae60f582","account1-test1","m1.medium","account1","test1"
"83dbc739-e436-4c9f-a561-c5b40a3a6da5","account3-test2","m1.tiny","account3,"test2"
"ef68fcf3-f624-416d-a59b-bb8f1aa2a769","account1-test3","m1.medium","account1","test3"

这里的任务是创建一个 python 脚本来打开原始 CSV 文件,并创建一个包含添加列的新 CSV 文件。有任何想法吗?我一直无法成功解析名称列。

标签: pythoncsvexport-to-csv

解决方案


您是否尝试过使用pandas DataFrame. 这可以通过以下方式完成:

df = pd.read_csv('input_data.csv')

如果customermisc列是另一个 csv 文件的一部分,您可以使用与上述相同的方法(命名df2)加载它,然后附加以下内容:

df['Customer'] = df2['Customer']

然后,您可以DataFrame使用以下内容将其输出为 csv 文件:

df.to_csv('output_data_name.csv')

推荐阅读