首页 > 解决方案 > 解释分类模型结果

问题描述

我一直在研究文本分类问题很长一段时间,我在解释结果和下一步去哪里时遇到了问题。

我一直在研究推文,试图对它们是否暴力进行分类。

结果是

对于大小为 1763(pos:214,neg:1549)的数据集,训练为 1234(pos:152,neg:1082)和测试集 529(pos:62,neg:469)

带有 BOW 特征的测试集的 AUC 分数 SVM:0.69 LR:0.67 1 层 NN:0.69

我无法解释问题是否在于拥有数据或更改模型。我认为由于不同的模型给出了相似的结果,这意味着我需要更多质量更好的数据和更多积极的例子。

我也不知道接下来该怎么办。

谢谢,

标签: machine-learningtwitterneural-networksvmtext-mining

解决方案


如果您在解释结果时遇到问题,您可以尝试不同的指标来评估分类的质量。例如,您可以尝试准确度、精确度、召回率和 f1 分数。在解释结果并确定您想要关注的指标之后,您可以探索不同的策略来改进它 - 例如,添加更多数据、执行超参数调整和/或尝试不同的模型。本书章节讨论文本分类评估并可能对您有所帮助:文本分类评估。谢谢


推荐阅读