首页 > 解决方案 > NLTK - 如何获取频率分布大于特定数字的项目

问题描述

如果列表超过一定数量,我正在尝试获取列表的频率分布。

例子:

import nltk
test_list=['aa', 'aa', 'bb', 'cc', 'dd', 'dd']
test_fd = nltk.FreqDist(test_list)

回报:

FreqDist({'aa': 2, 'dd': 2, 'bb': 1, 'cc': 1})

没有循环,我正在寻找所有大于 1 的项目。

使用 Python 3.8 和 NLTK 3.5

标签: python-3.xnltk

解决方案


它可以完成,filter您可以决定将 adict或 a list(元组)作为输出:

test_fd = dict(filter(lambda x: x[1] > 1, nltk.FreqDist(test_list).items()))

推荐阅读