首页 > 解决方案 > 从csv中查找python列表中的索引并组合标签

问题描述

我的代码是-

df=pd.read_csv("file")
l1=[]
l2=[]
for i, row in df.iterrows():
    
    l1.append(' '.join((row['house'], row['district'])))
    l2.append(({"entities": [[(ele.start(), ele.end() - 1) for ele in re.finditer(r'\S+', df['house'][i])] ,df['label1'][i]],}))
    
TRAIN_DATA=list(zip(l1,l2))
print(TRAIN_DATA)

CSV 文件 -

house       label1          district    label2 
House 263   holding_number  dhaka       district 
House 31    holding_number  comilla     district 

我得到的输出是[('House 263 dhaka', {'entities': [[(0, 4), (6, 8)], 'holding_number']}),

我的预期输出 -

[('House 263 dhaka', {'entities': [[(0, 8)], 'holding_number'], [[10,14], 'district']})

基本上,如何在此处获取第 3 列的索引并将其附加到 label2?另外,我想获取第 1 列(House 263)中整个字符串的索引。

标签: pythonpandaslistdataframedataset

解决方案


推荐阅读