首页 > 解决方案 > 如何从熊猫数据框中的列中删除不必要的信息

问题描述

我有一个由 200 行和 4 列银行信息组成的数据框。这些行是“日期”、“销售点”、“借方”和“贷方”。在销售点栏中有一大堆我不需要并且我想摆脱的额外信息。每一行都以“销售点-interac 零售购买......”开头,我想完全摆脱它,只保留商店的名称。我似乎无法弄清楚如何做到这一点。有人有什么想法吗?

标签: pythonpandas

解决方案


如果字符串每次都相同,这很容易:

replace_string = {'Point of sale-interac retail purchase':''}
df['point of sale'].replace(replace_string, inplace=True)

推荐阅读