首页 > 解决方案 > 如何通过错误分析深入了解文本分类?

问题描述

我正在为方言做文本分类。我正在使用带有 countVectorizer 的朴素贝叶斯分类器。我有很多错误分类的文本。有没有一种方法可以分析这些错误以找出分类出错的地方?例如,如果我可以知道哪些词被用于将文本误分类为 A,而它应该被分类为 B,然后我可以从 A 的语料库中取出这些词。

应该切换到使用聚类的无监督学习吗?还是神经网络和深度学习?如果朴素贝叶斯分类器不起作用。

另外,我怎么知道 countVectorizer 如何对文档进行分类?以及他使用哪些词对文档进行分类。

标签: pythonmachine-learningnlptext-classificationcountvectorizer

解决方案


推荐阅读