首页 > 解决方案 > nltk frequency_distribution.max() 需要多个结果

问题描述

我有一个数据框,其中有多篇新闻文章,并使用 spacy 从文本中提取了相关的产品名称。数据框中的每一行在 PY_Entities_Products 列中都有一个或多个条目。我试图通过以下方式仅提取最常见的元素:

import nltk
for index, row in df_test2.iterrows():
    list_of_words = row.PY_Entities_Products
    frequency_distribution = nltk.FreqDist(list_of_words)
    print("The Frequency distribution is -",frequency_distribution)
    most_common_element = frequency_distribution.max()
    print ("The most common element is -",most_common_element)

在抽奖的情况下(例如,新闻文章谈到了两种产品,并且都提到了 5 次),我希望提取两个产品名称。frequency_distribution.max() 只能提取一个。

什么是合适的解决方法/解决方案?

标签: python-3.xnlpnltkfrequency-distribution

解决方案


推荐阅读