python - 我的 WordCloud 缺少单词末尾的字母 's'
问题描述
起初我以为问题出在我的数据上,我在清理数据时犯了一个错误。但是我检查了它,但事实并非如此。
我正在使用这段代码:
import matplotlib.pyplot as plt
plt.style.use('fivethirtyeight')
allWords = ' '.join([twts for twts in df['full_text']])
wordCloud = WordCloud(collocations=True, width = 1000,
height=600, random_state = 21, max_font_size = 120).generate(allWords)
plt.imshow(wordCloud, interpolation = "bilinear")
plt.axis('off')
plt.show()
现在我的 wordcloud 显示诸如“coronaviru”、“viru”、“crisi”collocations=True
之类的词。它显示了与“coronavirus case”“coronavirus pandas”等其他词组合的完整词。有谁知道如何解决这一问题?就像我说的,我检查了数据,那里总是正确的完整单词。所以我猜这个错误发生在 wordcloud 上。
我的数据如下所示:
created_at id full_text
0 Sat Aug 01 00:25:53 +0000 2020 28934685093219 life is hard with coronavirus
1 Sat Aug 01 00:25:53 +0000 2020 28934685093219 coronavirus sucks
解决方案
你做错了什么,你的代码对我有用:
import pandas as pd
import matplotlib.pyplot as plt
from wordcloud import WordCloud
array = {'full_text': ['life is hard with coronavirus', 'coronavirus sucks']}
df = pd.DataFrame(array)
plt.style.use('fivethirtyeight')
allWords = ' '.join([twts for twts in df['full_text']])
wordCloud = WordCloud(collocations=True, width = 1000,
height=600, random_state = 21, max_font_size = 120).generate(allWords)
plt.imshow(wordCloud, interpolation = "bilinear")
plt.axis('off')
plt.show()
这是输出:
推荐阅读
- c++ - Lamba 取决于模板依赖值作为该模板的构造函数的默认值在 MSVC 上失败
- python - 为什么这个测试方法只能在单独的类中运行?
- conditional-statements - 在 Netlogo 的条件语句中,括号是否与“and”和“or”一起使用?
- graphql - graphql查询中的多项选择
- numpy - 在 google colaboratory 上处理自动编码器时如何处理大型训练集?
- linux - 如何使用 grep 提取第三列?
- javascript - 如何在 HTML/CSS 中有可选的分屏布局?
- node.js - 如何处理多个 API 请求
- apache - .htaccess 重定向除某个域的一个和另一个内部重定向之外的所有页面
- python-3.x - 如何在 django-rest 中设置默认的内部序列化程序数据?