dataframe - 查找数据框中同一列的另一个行字符串中包含的行的字符串并将它们隔离
问题描述
我正在寻找一个字符串(UPC)是否包含在另一个字符串(同一数据帧的另一个 UPC)中。我的问题是“相同”UPC 有重复,但字符更多,因此标准功能没有帮助。当新产品通过 csv 文件导入系统时,UPC 的最后一个字符应该被删除,但显然这并不总是如此。现在它导致很多重复。我试图隔离这些“重复”以便稍后检查它们并只保留好的。我尝试了很多方法,但我最终承认我应该问。关于如何循环和检查这个有什么建议吗?
我以前在考虑使用第二个数据框,其中将有 2 列: Columns1 :第一个 UPC(最短的一个包含在较长的一个中);第 2 列:第二个 UPC(最长的一个)
产品代码 | UPC | 供应商代码 | 描述 | 数量_价格 | pack_price | pack_num | 单价 | 玛吉 |
---|---|---|---|---|---|---|---|---|
P273599 | 4667727359 | 1 | 飞利浦荧光灯 | 3.79 | 54.6 | 30 | 1.82 | 51.98 |
BZA1303 | 5209200303 | 1 | HFA PROTEGE 4 EN 铝 | 1.79 | 72 | 100 | 0.72 | 59.78 |
BZA0921S | 5209201399 | 1 | HFA 内容 PROFONDS EN ALUM | 1.99 | 21.84 | 4 | 0.91 | 54.27 |
BZA2017S | 5209202017 | 1 | HFA 大烤肉矩形 | 2.29 | 25.75 | 25 | 1.03 | 55.02 |
BZA0303B | 5209202303 | 1 | HFA PROTEGE 4 EN 铝 1/PQT | 1.49 | 64 | 100 | 0.64 | 57.05 |
解决方案
推荐阅读
- javascript - Javascript Vue 或 React 存储敏感信息客户端安全
- python - 减少和一个 numpy 数组的最有效方法(使用 autograd)
- javascript - 导入时出现“未捕获的语法错误:意外的令牌 {”
- javascript - 高级 JMeter 循环
- c++ - 从继承的类 C++ 进行强制转换
- python-3.x - 通过 gspread 对电子表格进行排序
- c++ - 具有重载方法的可变数据结构
- python - 如何在 Python 2.7 中使用 tkinter 库
- google-apps-script - 如何根据列中的数据添加或删除行
- javascript - 如何从 Bootstrap 4 下拉项目菜单中显示所选项目