首页 > 解决方案 > 有什么方法可以改变多类分类问题中目标类的数量?

问题描述

我有一个包含 13 个类的文本数据集。有些类是重叠的。但是,为了证明这些类是重叠的,我希望在具有 13 个标签的数据上训练一个机器学习分类器,然后在更少的标签上测试它,比如 10,11 等,以找出不重叠目标标签的最小数量是多少将在数据集中。

请告诉我如何在测试分​​类器时更改标签的数量?

先感谢您!

标签: pythonmachine-learningnlp

解决方案


找到重叠类的一种方法是用所有 13 个类训练你的机器学习分类器,并在测试集上绘制一个像这样的混淆矩阵(使用 matplotlib)。例如 - 您的混淆矩阵如下所示。在这里,您可以看到 0 类和 3 类看起来像重叠的类,因为它们之间的分类错误率很高。因此,通过这种方式,您可以找出重叠的类。

在此处输入图像描述


推荐阅读