python - Python nltk.util ngram 输出格式错误
问题描述
我是 Python 新手,正在做我的第一个课程作业练习。试图将一些文本转换为 trigram 标记,但我没有得到预期的输出:
from nltk.util import ngrams
def process_text(text, n = 1):
tokens = [token for token in text.split(" ") if token != ""]
tokenised = list(ngrams(tokens, n))
return tokenised
process_text("knife pot spoon hammer nail", 3)
输出:
[('knife', 'pot', 'spoon'),
('pot', 'spoon', 'hammer'),
('spoon', 'hammer', 'nail')]
输出应如下所示:
['knife pot spoon',
'pot spoon hammer',
'spoon hammer nail]
解决方案
推荐阅读
- event-sourcing - 如果我们在投影后触发事件有什么缺点?
- django-templates - Django PolygonField - 如何在地图上显示?
- c++ - 为什么下面的函数模板代码编译不出来?
- jenkins - 是什么触发了 Jenkins 中的支持日志
- python - Python liste par 理解
- reactjs - React js - 添加唯一键 onClick
- python - 在 Jinja 中循环多个值
- javascript - 如何使用 PHP 和 MySQL 从 Google Chart API 生成动态数据?
- angular - 未捕获的类型错误:无法读取角度中 null 的属性“addEventListener”
- javascript - 使用另一个脚本标签自定义从 Angular 8 创建的自定义元素 javascript 文件