首页 > 解决方案 > 如何优化基于 TextBlob 的文本分析模型?

问题描述

我刚刚构建了一个基于TextBlob. 我已经对en-sentiment.xml文件进行了大量修改,以包含我们部门常用的一些单词。我们在合规论坛工作,因此输入文本分析工具的文本性质非常正式和结构化。

我遇到的问题是“双重否定”。声明 - “根据我们的审查,没有发现重大例外。” - 是一个总体积极的声明,因为我们实际上是在说我们的审查后没有任何问题。但是,TextBlob polarity返回的分数是-0.02,这是不对的。我希望这非常接近 1。

单词no,materialexception在词典文件中分别被归类为否定词、中性词和否定词en-sentiment.xml,我已经考虑了停用词的影响。

任何人都可以建议一种方法来解决这个问题吗?实际上,我要问的是如何在这种情况下提高极性分数。谢谢!

PS我只是TextBlob作为一个起点进行实验;我很想听听任何使用 Python 中的其他 NLP 工具/包/库成功适应自然语言处理以进行正式/结构化文本分析的人的更多信息。

标签: nlpnltktextblob

解决方案


推荐阅读