python - Python中如何根据句子的数量计算两个单词之间的距离?
问题描述
我有一个数据集,其中i
和j
在两个列表中提取。现在我必须检查它是否应该在同一个句子中返回,否则计算 and 之间的i
句子数。j
0
i
j
a
b
c
<coref coref_coref_class="set_0" coref_mentiontype="ne" markable_scheme="coref" coref_coreftype="atr">
aa
bb
</coref>
,
<coref coref_coref_class="set_0" coref_mentiontype="np" markable_scheme="coref" coref_coreftype="atr">
aa
dd
ff
</coref>
m
n
.
# first senetence end here
现在我只提取标签内的文本来i
列出i_NP
和列出。如何在同一个句子中包含检查 if和,然后返回,否则j
j_NP
.
i
j
0
1
i_NP = []
j_NP = []
find_coref = re.findall(r'<coref.*?coref_coref_class="set.*?>(.*?)</coref>', read_dataset, re.S)
coref_list = list(map(lambda x: x.replace('\n', ' '), find_coref))
for i in range(0,len(coref_list)-1,2):
i_NP.append(str(coref_list[i]))
j_NP.append(str(coref_list[i+1]))
解决方案
推荐阅读
- arduino - Arduino IDE 中从 int 到 char* 的无效转换
- unit-testing - 如何验证在飞镖单元测试中作为参数传递的函数
- javascript - MongoDB 无法获取所有数据
- python - 从字符串中删除子字符串,如 lstrip 但不是单个字符
- delphi - Delphi DunitX,我如何获得当前正在运行的测试的名称?
- java - 仅当字符串包含字母、数字、空格或逗号时才打印字符串
- algorithm - 寻找最长交替序列长度的动态算法
- amazon-web-services - 如何在不使用预签名 URL 的情况下在 s3 私有存储桶中公开 s3 对象
- java - 将 Web 应用升级到 Spring Boot 2.4 后出现 IllegalStateException
- python - 如何将两个json文件合并为一个?