首页 > 解决方案 > 查找数据框中同一列的另一个行字符串中包含的行的字符串并将它们隔离

问题描述

我正在寻找一个字符串(UPC)是否包含在另一个字符串(同一数据帧的另一个 UPC)中。我的问题是“相同”UPC 有重复,但字符更多,因此标准功能没有帮助。当新产品通过 csv 文件导入系统时,UPC 的最后一个字符应该被删除,但显然这并不总是如此。现在它导致很多重复。我试图隔离这些“重复”以便稍后检查它们并只保留好的。我尝试了很多方法,但我最终承认我应该问。关于如何循环和检查这个有什么建议吗?

我以前在考虑使用第二个数据框,其中将有 2 列: Columns1 :第一个 UPC(最短的一个包含在较长的一个中);第 2 列:第二个 UPC(最长的一个)

产品代码 UPC 供应商代码 描述 数量_价格 pack_price pack_num 单价 玛吉
P273599 4667727359 1 飞利浦荧光灯 3.79 54.6 30 1.82 51.98
BZA1303 5209200303 1 HFA PROTEGE 4 EN 铝 1.79 72 100 0.72 59.78
BZA0921S 5209201399 1 HFA 内容 PROFONDS EN ALUM 1.99 21.84 4 0.91 54.27
BZA2017S 5209202017 1 HFA 大烤肉矩形 2.29 25.75 25 1.03 55.02
BZA0303B 5209202303 1 HFA PROTEGE 4 EN 铝 1/PQT 1.49 64 100 0.64 57.05

标签: dataframeloopssubstringrowfiltering

解决方案


推荐阅读