keras - Keras 中超过 1700 个类别的多标签分类
问题描述
我有一个巨大的蛋白质数据集。具有 9800 个特征和大约 1700 个类别标签。每个样本可以有 4 或 5 个类别标签。我已经设计了模型并进行了初步培训。我得到了非常高的准确性,我知道这是为什么。我的问题是哪个优化器和损失函数可以准确地获得好的结果。此外,任何人都可以帮助我使用自定义准确度指标,因为它需要基于张量,这被证明有点棘手。
解决方案
如果单独使用,准确度不是分类问题的好指标。检查什么是混淆矩阵。首先检查您的课程是否平衡。损失函数的选择很大程度上取决于此。想象一个由 90 个标签为 0 的观测值和 10 个标签为 1 的观测值组成的数据集。总是选择 0 的分类器获得 90% 的准确率,即使它是可能的最差分类器。
优化器不是很重要。去找亚当吧。当您的模型产生有趣的结果时,您可以调整优化器。
推荐阅读
- nginx - 最新 Docker 映像的服务器名称中的参数数量无效
- html - 如何将多个 a 标签彼此对齐?
- java - 在Java中读取输入整数
- react-native - 如何从一个堆栈屏幕导航到另一个堆栈屏幕?
- android - Flutter - WebView 不适用于 Android
- javascript - 当自定义参数从子组件获取数据时,如何在 React 中除了您自己的自定义参数之外传递事件参数
- android - 我的图像没有使用 RecyclerView 显示?
- javascript - Vue.js如何在mounted()之前观察,无法从观察中获取数据
- ios - TableView 不重新加载数据,有时在尝试使用断点时重新加载数据
- java - Spring @Bean 方法中返回接口的限制