python - 在 kwic 中的给定关键字之前获取/添加字符串
问题描述
您好,我正在处理上下文中的关键字,我在给定字符串之后得到了上下文,我还想打印给定字符串之前的 3 个字符串。
def file(data):
tokens = []
for line in data:
tokens.extend(line.strip().split())
return tokens
lists = []
def keycontext(lines, word):
liste = []
for i in range(len(lines)):
if (lines[i] == word):
lists.append(" ".join(lines[i:i+int(2)+1])) #lines[i-int(0):i]+
return lists
keyword = input("write keyword")
print("You've written ", keyword)
text = file(data['clean_text'])
result = keycontext(text,keyword)
作为列表的输出,我得到了这个
['faire un nouveau', 'faire et qui', 'faire avec les', 'faire au vrai', ....
我也想在马戏团之前得到字符串
我该如何处理这条线
lists.append(" ".join(lines[i:i+int(2)+1])) #lines[i-int(0):i]+
解决方案
- 从您的评论中,我了解到您在单词匹配之前需要 2 个单词。您可以为此添加条件。
def file(data):
tokens = []
for line in data:
tokens.extend(line.strip().split())
return tokens
lists = []
def keycontext(lines, word):
liste = []
for i in range(len(lines)):
if (lines[i] == word):
lists.append(" ".join(lines[min(0,i-2):i+int(2)+1])) #lines[i-int(0):i]+
return lists
keyword = input("write keyword")
print("You've written ", keyword)
text = file(data['clean_text'])
result = keycontext(text,keyword)
推荐阅读
- python - 是否有人在加载 Keras 保存的模型时得到“AttributeError: 'str' object has no attribute 'decode'”
- database - 我想创建一个数据库表,哪种数据类型更适合存储字母数字值?
- javascript - Chart.js 中不同数量的标签和数据
- powerbi - Power BI 显示前几天的值
- docker - Docker 边缘门户
- java - Java android机房二外键
- php - 如何在新的多维数组中分离具有相同索引的键值
- node.js - Loopback 4 调试器 nodemon 解决方案
- reactjs - EsLint - 无法解析模块的路径
- wordpress - 联系表格 7 重定向问题