python - 从csv中查找python列表中的索引并组合标签
问题描述
我的代码是-
df=pd.read_csv("file")
l1=[]
l2=[]
for i, row in df.iterrows():
l1.append(' '.join((row['house'], row['district'])))
l2.append(({"entities": [[(ele.start(), ele.end() - 1) for ele in re.finditer(r'\S+', df['house'][i])] ,df['label1'][i]],}))
TRAIN_DATA=list(zip(l1,l2))
print(TRAIN_DATA)
CSV 文件 -
house label1 district label2
House 263 holding_number dhaka district
House 31 holding_number comilla district
我得到的输出是[('House 263 dhaka', {'entities': [[(0, 4), (6, 8)], 'holding_number']}),
我的预期输出 -
[('House 263 dhaka', {'entities': [[(0, 8)], 'holding_number'], [[10,14], 'district']})
基本上,如何在此处获取第 3 列的索引并将其附加到 label2?另外,我想获取第 1 列(House 263)中整个字符串的索引。
解决方案
推荐阅读
- java - 这个 Maven 原型列表来自哪里?
- java - 解压缩 Gzip JSON 响应:StreamCorruptedException:无效流标头:7B227061
- amazon-web-services - Windows cmd上的AWS配置问题
- c# - 标题中的特定占位符 ${...} 正在拆分
- xamarin - Core Image 人脸检测提供零个人脸 - xamarin.ios
- html - 为什么所有图像都没有出现在屏幕上,因为我想创建一个图像滑块?简而言之,为什么图像不会走出屏幕?
- mdriven - MDriven | 即使默认设置为 Modlr,Modlr 也会在 XML 编辑器中打开
- batch-file - 为什么 xcopy 使用批处理文件创建另一个新文件夹
- c# - c#如何使用实时图表恢复Y轴
- java - Java - 编译错误 - 找不到符号 - 变量终端