nlp - 来自测试数据的模型精度与混淆矩阵精度之间的差异
问题描述
- 我正在为 NLP 项目工作,我想使用神经 n/w 进行文本分类
- 我从测试集中获得了非常好的准确率,达到了 98%。
- 但是,当我尝试检查混淆矩阵的准确度(使用混淆矩阵的准确度得分)时,它只有 52%。
- 这怎么可能?我在这里想念什么?
问题
两者的准确度之间有什么区别,哪一个应该被视为实际准确度?为什么?
测试集上的代码
loss, acc = model.evaluate(Xtest, y_test_array)
解决方案
看起来您的数据集存在类别不平衡,并且从混淆矩阵计算的指标(它不是准确性 - 可能类似于 F1 分数)很低,因为少数类别的识别率很低。同时,准确度很高,因为多数类被很好地识别。
推荐阅读
- python - Jupyter - 从另一个分区打开文件
- swift - 为什么 Swift 库使用“enum CommandLine”而不是“struct CommandLine”?
- javascript - 将矩范围导入 Angular 4.x 应用程序(ES6) - 没有兼容的调用签名错误?
- html - 我已经尝试让这个@media 代码工作 30 分钟,但我仍然找不到答案
- junit - Junit:org.mockito.exceptions.misusing.MissingMethodInvocationException:
- hive - 为什么单个计数与蜂巢中的总体计数不同
- iis - Laravel 尝试从旧文件夹加载文件
- python-3.x - 无法在 sqlite 数据库中插入唯一值
- mysql - 将 PHP 变量传递给 MySQL 触发器#nette
- jquery - 为什么 html() 会丢失类分配?