首页 > 解决方案 > Keras 中超过 1700 个类别的多标签分类

问题描述

我有一个巨大的蛋白质数据集。具有 9800 个特征和大约 1700 个类别标签。每个样本可以有 4 或 5 个类别标签。我已经设计了模型并进行了初步培训。我得到了非常高的准确性,我知道这是为什么。我的问题是哪个优化器和损失函数可以准确地获得好的结果。此外,任何人都可以帮助我使用自定义准确度指标,因为它需要基于张量,这被证明有点棘手。

标签: kerasdeep-learning

解决方案


如果单独使用,准确度不是分类问题的好指标。检查什么是混淆矩阵。首先检查您的课程是否平衡。损失函数的选择很大程度上取决于此。想象一个由 90 个标签为 0 的观测值和 10 个标签为 1 的观测值组成的数据集。总是选择 0 的分类器获得 90% 的准确率,即使它是可能的最差分类器。

优化器不是很重要。去找亚当吧。当您的模型产生有趣的结果时,您可以调整优化器。


推荐阅读