首页 > 解决方案 > 如何从 Python 中的数据中删除多余的逗号

问题描述

我有一个 CSV 文件,我试图通过该文件将数据加载到包含 2 列的 SQL 表中。我有 2 列,数据用逗号分隔,用于标识下一个字段。第二列包含文本和该文本中的一些逗号。由于额外的逗号,我无法将数据加载到我的 SQL 表中,因为它看起来有额外的列。我有数百万行数据。如何删除这些多余的逗号?

数据:

Number Address
"12345" , "123 abc street, Unit 345"
"67893" , "567 xyz lane"
"65432" , "789 unit, mno street"

我想删除随机行地址中多余的逗号。

标签: pythondatabasepandasdata-sciencetext-processing

解决方案


如果您的所有数据都采用相同的格式,如Number Address "000" , "000 abc street, Unit 000",您可以拆分列表,删除逗号,然后将列表重新组合在一起,使其再次成为字符串。例如使用您提供的数据:

ori_addr = "Number Address \"12345\" , \"123 abc street, Unit 345\""
addr = ori_addr.split()
addr[6] = addr[6].replace(",", "")
together_addr = " ".join(addr)

together_addr 等于 "Number Address "12345" , "123 abc street Unit 345" 注意 "street" 和 "Unit" 之间没有逗号。


推荐阅读