首页 > 解决方案 > 处理情绪的 NA

问题描述

我使用“afinn”包对大约 500,000 条推文的数据框进行了情绪分析。我注意到许多推文都带有 NA 的情绪,因为推文中没有来自 afinn 的文字。

500,000 条推文来自 500 个不同的用户,我想找出他们发送的推文的平均情绪。将 NA 替换为 0 然后计算平均情绪的正确方法,还是我应该从计算中省略 NA 推文。

谢谢!

标签: rtwittersentiment-analysis

解决方案


我会将 NA 更改为零,理由是如果推文中没有正面/负面情绪词,那么它就是中性推文。

如果一个人有 9 条平均为 0.50 的正面推文、1 条为 -0.50 的负面推文和零条中性推文,即平均值为 +0.40,这表明如果你随机抽样他们的一条推文,它很可能具有正面情绪。

将其与具有相同 9 条和 1 条正面/负面推文但 40 条中性推文的人进行比较。平均值为 +0.01。这更接近于随机抽样他们的一条推文的预期,它几乎没有情绪。


推荐阅读