machine-learning - 基于无监督方面的情感分析中的问题
问题描述
我正在研究基于无监督方面的情感分析。我尝试使用 Vader,这给了我很好的结果,但问题是如果主题是负面的,比如“食物浪费”,那么即使内容说“我真的很讨厌食物浪费”,情绪总是会变得消极。有人可以帮助我解决这个问题,甚至可以建议我比维德更好的方法。我也尝试过使用“Flair”,但它的结果不如 Vader 有希望。
解决方案
在这种情况下,VADER 使用的基于规则的模型可能不是一个好方法,在那个短语中,你有 3 个单词肯定会得到负分(讨厌食物浪费),记住 VADER 是针对简洁的社交媒体数据进行优化的,它不能很好地掌握短语的“上下文”。
与 VADER 类似的方法是我们在 TextBlob 中,您可以尝试做很多工作:https ://textblob.readthedocs.io/en/dev/
通常有监督的路线会给出更好的结果,但你需要一个好的预训练模型和好的数据。
scikit-learn 中的朴素贝叶斯分类器: https ://www.datacamp.com/community/tutorials/simplifying-sentiment-analysis-python
随机森林方法,始终使用 scikit-learn: https ://stackabuse.com/python-for-nlp-sentiment-analysis-with-scikit-learn/
以下是对情绪分析的各种方法的回顾: https ://towardsdatascience.com/fine-grained-sentiment-analysis-in-python-part-1-2697bb111ed4
推荐阅读
- python - 熊猫:动态查找当前星期的星期天的日期并放置在数据框中的空单元格中
- php - 如何在php中使用xpath读取具有相同多个节点名的xml内容?
- javascript - 使用正则表达式拆分字符串会产生意想不到的结果
- c# - Lync SDK BeginSendMessage AsyncCallback
- queue - Hazelcast 使用 EntryProcessor executeOnEntries 入队
- android-layout - 带有导航组件的单个 Activity:如何处理不同的 AppBar / 主题
- html - 具有动态大小的子项的容器的 CSS 滚动
- java - 为什么我可以更改类成员但不能更改类变量甚至原始值
- r - R Programming 循环遍历企业并确定它们是否在 90 天内发货
- c# - dotnetcasclient 重定向问题,没有生成日志