nlp - 如何优化基于 TextBlob 的文本分析模型?
问题描述
我刚刚构建了一个基于TextBlob
. 我已经对en-sentiment.xml
文件进行了大量修改,以包含我们部门常用的一些单词。我们在合规论坛工作,因此输入文本分析工具的文本性质非常正式和结构化。
我遇到的问题是“双重否定”。声明 - “根据我们的审查,没有发现重大例外。” - 是一个总体积极的声明,因为我们实际上是在说我们的审查后没有任何问题。但是,TextBlob
polarity
返回的分数是-0.02
,这是不对的。我希望这非常接近 1。
单词no
,material
和exception
在词典文件中分别被归类为否定词、中性词和否定词en-sentiment.xml
,我已经考虑了停用词的影响。
任何人都可以建议一种方法来解决这个问题吗?实际上,我要问的是如何在这种情况下提高极性分数。谢谢!
PS我只是TextBlob
作为一个起点进行实验;我很想听听任何使用 Python 中的其他 NLP 工具/包/库成功适应自然语言处理以进行正式/结构化文本分析的人的更多信息。
解决方案
推荐阅读
- laravel - Sendgrid SMTP 不工作,但 CURL api 工作正常
- filesystems - 注册为处理程序时,iOS 无法从“文件”应用程序读取/打开文件
- css - 为什么将类移动到 Angular 中的共享 css 文件会增加包大小
- javascript - React、单页应用程序和浏览器的后退按钮
- twitter-bootstrap - 排序一个
在 Bootstrap-Vue 中按列并禁止用户排序 - c++ - 将不同类型的值传递给着色器
- reactjs - 如何在iannbing / TreeMenu React中附加一个为每个ItemComponent提供参数的函数?
- android - 如果没有带有限定依赖项的 @Provides-annotated 方法,则无法提供 Dagger 2
- android - 如何在颤动的抽屉小部件中使用与底部导航栏相同的导航路线?
- ios - SwiftUI - 使用拖动手势向一个方向移动视图