python - python中用带空格和不带空格的引号`'`分隔的列表和分词句子
问题描述
我有一个数据集,通过正则表达式我提取了数据。我使用sent_tokenize
NLTK 的方法为我定义了句子边界。
tok = sent_tokenize(str(all_text))
print(tok[0])
It give me this output:
# List of string
tok = ['Hi ' , hello at 'this ', there 'from ']
现在,我从该数据集中提取的注释数据如下所示:
i = ['there' , 'hello', 'Hi']
如果您看到,在tok list
第一个引号中带有单词,而结束引号中带有空格。但是在i
列表中,列表的一个元素是用引号关闭的,没有空格。当我想检查 in 是否有任何元素时i
,tok
它应该给我一个结果。但检测不到里面的文字tok
。
解决方案
这应该可以解决您的问题:
tok = [j.strip() for j in tok]
推荐阅读
- c++ - ANTLR 4.7.1:antlr4-runtime 中的 C++ 代码包含不正确的路径,可能是由于 .vscode 中的 includePath 不正确
- vue.js - 鼠标事件处理程序在 vue-mapbox 包中不起作用
- c# - 与多个数据表的左外连接
- html - 页脚与页面内容重叠
- html - 当我调整浏览器窗口大小时,图像保持不变
- python - 如何使用 urllib 伪造 mozilla 访问权限?
- mongodb - 将 MongoDB Atlas 与 Flutter 结合使用
- numpy - 从 2D 图像计算 3D 空间中平面上的角度
- spring - 如何为 HTTP 请求实现队列?
- c++ - 使用 C++ 在 UDP 中进行连接管理