首页 > 解决方案 > Python数据框搜索另一个数据框

问题描述

我试图找出将数据框与值列表(几乎 180 个值)进行比较的最佳方法,例如如下所示

['bizservice.consulting','bizservice.datamgmt','bizservice.hr'] 针对另一个具有 4 M 记录的数据帧,其字段值如下所示。

['consumerservices?5', 'hospitality?5', 'hospitality.travel?5']
['bizservice?12', 'bizservice.hr?12']
['hospitality?83', 'hospitality.lodging?83']
['bizservice.techconsulting?16', 'bizservice?16', 'software?16']

不知道如何根据没有数字代码的第一个数据帧进行比较并从第二个数据帧中检索匹配记录。

这是我尝试过的

import pandas as pd
industry = pd.read_csv('industry.csv')
data= pd.read_csv('rawdata.csv') 
datafilter=data[data["industry"].isin (industry)]

但这只有在数据中的列表与行业数据框完全匹配并且我尝试了“包含”但它只能与字符串一起使用时才会有所帮助

标签: pythonstringdataframe

解决方案


推荐阅读