python-3.x - nltk frequency_distribution.max() 需要多个结果
问题描述
我有一个数据框,其中有多篇新闻文章,并使用 spacy 从文本中提取了相关的产品名称。数据框中的每一行在 PY_Entities_Products 列中都有一个或多个条目。我试图通过以下方式仅提取最常见的元素:
import nltk
for index, row in df_test2.iterrows():
list_of_words = row.PY_Entities_Products
frequency_distribution = nltk.FreqDist(list_of_words)
print("The Frequency distribution is -",frequency_distribution)
most_common_element = frequency_distribution.max()
print ("The most common element is -",most_common_element)
在抽奖的情况下(例如,新闻文章谈到了两种产品,并且都提到了 5 次),我希望提取两个产品名称。frequency_distribution.max() 只能提取一个。
什么是合适的解决方法/解决方案?
解决方案
推荐阅读
- sas - 无法通过 SAS Enterprise Guide 连接到 Sybase 数据库
- bash - 你能详细解释一下bash命令吗?
- node.js - 有没有办法使用节点 JS 在 PDF 中查找空白?
- css - 如何在 Material-UI 中使图像稍微偏离对话框
- java - Android OpenGL:Cube的光照问题?
- linux - RT 补丁可用于 5.10.9 吗?
- flutter - 我收到一个错误“类型‘Null’不是‘List’类型的子类型
'" 在第 57 行运行我的颤振程序时 - cx-freeze - ImportError:导入 QtCore 时 DLL 加载失败?
- reactjs - 如何为中心选项卡栏项创建自定义操作
- flutter - Flutter 中的 Markdown 用法