python - 如何通过错误分析深入了解文本分类?
问题描述
我正在为方言做文本分类。我正在使用带有 countVectorizer 的朴素贝叶斯分类器。我有很多错误分类的文本。有没有一种方法可以分析这些错误以找出分类出错的地方?例如,如果我可以知道哪些词被用于将文本误分类为 A,而它应该被分类为 B,然后我可以从 A 的语料库中取出这些词。
应该切换到使用聚类的无监督学习吗?还是神经网络和深度学习?如果朴素贝叶斯分类器不起作用。
另外,我怎么知道 countVectorizer 如何对文档进行分类?以及他使用哪些词对文档进行分类。
解决方案
推荐阅读
- css - 为什么使用 React Native 会模糊图像?
- scala - 如何编译一个凿码?有没有在线编译器?
- python - Python中的算法 - 将具有相同爱好的人分组
- swift - 为什么结构类型 UUID 不可发送?
- r - PCA 作为插入符号中 KNN 模型的预处理不起作用
- angular - How to filter an array of object by comparing its id with the values of a different array
- python - 在 SciPy 中拟合分布时如何检查收敛性
- c# - 在 IOS 的 ionic 5 中安装 FCM 插件后,InAppBrowser 无法正常工作
- http - 将itm.txt数据转成json格式
- html - 把图片推到卡片外面后,只显示一半