r - 处理情绪的 NA
问题描述
我使用“afinn”包对大约 500,000 条推文的数据框进行了情绪分析。我注意到许多推文都带有 NA 的情绪,因为推文中没有来自 afinn 的文字。
500,000 条推文来自 500 个不同的用户,我想找出他们发送的推文的平均情绪。将 NA 替换为 0 然后计算平均情绪的正确方法,还是我应该从计算中省略 NA 推文。
谢谢!
解决方案
我会将 NA 更改为零,理由是如果推文中没有正面/负面情绪词,那么它就是中性推文。
如果一个人有 9 条平均为 0.50 的正面推文、1 条为 -0.50 的负面推文和零条中性推文,即平均值为 +0.40,这表明如果你随机抽样他们的一条推文,它很可能具有正面情绪。
将其与具有相同 9 条和 1 条正面/负面推文但 40 条中性推文的人进行比较。平均值为 +0.01。这更接近于随机抽样他们的一条推文的预期,它几乎没有情绪。
推荐阅读
- javascript - 如何限制可拖动区域?它在顶部和左侧起作用,但在右侧和底部不起作用
- ruby-on-rails - 表单远程:trueauthentity_token 消失
- javascript - 如何让 jQuery 对话框按钮超出对话框并彼此相邻显示?
- java - AppDynamics 将包含 UUID 的 REST 端点分组为单个业务事务
- c - 在 C 中实现函数重载的最佳方法是什么?
- r - 更改 navbarPage 元素中的背景颜色和字体功能
- laravel - Laravel 和 Passport 获取 SQLSTATE [42S22]:找不到列:1054 未知列 'api_token'
- reactjs - 为什么这个 setState 调用不会触发渲染?
- c++ - 知道在 C++ 中生成的特定二进制文件是由哪个编译器决定的吗?
- react-native - React Native 返回响应错误代码 500