python - Python NLTK FreqDist - 列出频率大于 1000 的单词
问题描述
我正在尝试输出出现在我的标记中超过 1000 次(> 1000)的每个单词并将其保存到 freq1000。
freq1000 = []
newtokens = []
for words in tokens:
newtokens += words
FreqDist(newtokens)
fd_1 = FreqDist(newtokens)
for i in set(fd_1):
if fd_1.count(i) == >1000:
print(i)
这是我当前的代码,在此之后我完全卡住了,我不确定是否有一个我可以用来提供帮助的 freqdist 函数。我已成功将 FreqDist 保存到 fd_1。我只是不确定如何获得出现超过 1000 次的单词的输出并将其保存到 freq1000。
我将不胜感激您能提供的任何帮助。
解决方案
您可以使用以下方法根据频率计数过滤单词freqDist.items()
:
list(filter(lambda x: x[1]>=1000, fd_1.items()))
希望能帮助到你 :)
推荐阅读
- html - css 伪 :active => 停止传播
- ios - 在地图视图上用纬度和经度绘制特定位置
- react-native - 如何在 React Native 中定义路由而不在导航器中显示它们?
- html - 动画延迟工作不正常
- typescript - 如何在nestjs中通过socket.io在客户端之间发送图像?
- c# - 多对多 EF Core 已被跟踪 - C# Discord Bot
- excel - 使未列出的数据看起来像在将其放入表格之前
- python - 使用循环和列表检查值 - Python
- javascript - 使用 JavaScript 自动填充 Django 模型字段始终失败
- sql - 每列值 XX 行的随机样本