首页 > 解决方案 > 我的 WordCloud 缺少单词末尾的字母 's'

问题描述

起初我以为问题出在我的数据上,我在清理数据时犯了一个错误。但是我检查了它,但事实并非如此。

我正在使用这段代码:

import matplotlib.pyplot as plt
plt.style.use('fivethirtyeight')

allWords = ' '.join([twts for twts in df['full_text']])
wordCloud = WordCloud(collocations=True, width = 1000,
height=600, random_state = 21, max_font_size = 120).generate(allWords)

plt.imshow(wordCloud, interpolation = "bilinear")
plt.axis('off')
plt.show()

现在我的 wordcloud 显示诸如“coronaviru”、“viru”、“crisi”collocations=True之类的词。它显示了与“coronavirus case”“coronavirus pandas”等其他词组合的完整词。有谁知道如何解决这一问题?就像我说的,我检查了数据,那里总是正确的完整单词。所以我猜这个错误发生在 wordcloud 上。

我的数据如下所示:

    created_at                        id                full_text
0   Sat Aug 01 00:25:53 +0000 2020    28934685093219    life is hard with coronavirus
1   Sat Aug 01 00:25:53 +0000 2020    28934685093219    coronavirus sucks

标签: pythonpandasmatplotlibword-cloud

解决方案


你做错了什么,你的代码对我有用:

import pandas as pd
import matplotlib.pyplot as plt
from wordcloud import WordCloud

array = {'full_text': ['life is hard with coronavirus', 'coronavirus sucks']}
df = pd.DataFrame(array)

plt.style.use('fivethirtyeight')
allWords = ' '.join([twts for twts in df['full_text']])
wordCloud = WordCloud(collocations=True, width = 1000,
height=600, random_state = 21, max_font_size = 120).generate(allWords)

plt.imshow(wordCloud, interpolation = "bilinear")
plt.axis('off')
plt.show()

这是输出:

在此处输入图像描述


推荐阅读