首页 > 解决方案 > python中用带空格和不带空格的引号`'`分隔的列表和分词句子

问题描述

我有一个数据集,通过正则表达式我提取了数据。我使用sent_tokenizeNLTK 的方法为我定义了句子边界。

tok = sent_tokenize(str(all_text))
print(tok[0])
It give me this output:


# List of string 
tok = ['Hi ' ,  hello at 'this ', there 'from ']

现在,我从该数据集中提取的注释数据如下所示:

i = ['there' , 'hello', 'Hi']

如果您看到,在tok list第一个引号中带有单词,而结束引号中带有空格。但是在i列表中,列表的一个元素是用引号关闭的,没有空格。当我想检查 in 是否有任何元素时itok它应该给我一个结果。但检测不到里面的文字tok

标签: python

解决方案


这应该可以解决您的问题:

tok = [j.strip() for j in tok]

推荐阅读