首页 > 解决方案 > 没有标签的深度学习分类

问题描述

我必须参与一个关于分类的深度学习应用的研究项目。我有一个包含超过 35000 个特征的庞大数据集——这些都是很好的值,取自实验室。

这个想法是我应该创建一个分类器,它必须告诉给定一个新的输入,如果数据看起来是好的。我必须将深度学习与 keras 和张量流结合使用。

问题是数据没有分类。我将输入一个新列,其中 1 表示好,0 表示坏。问题是,鉴于整个训练集都很好,我如何才能确定一个条目是否不好?

我曾考虑过生成一些垃圾数据,但我不知道这是否是个好主意——我什至不知道如何生成它。你有什么建议吗?

标签: machine-learningkerasdeep-learningclassificationunsupervised-learning

解决方案


我将从异常检测开始。您可以首先使用 fe (堆叠)自动编码器减少特征,然后使用 sklearn 中的局部异常值因子:https ://scikit-learn.org/stable/modules/outlier_detection.html

您需要首先减少特征的原因是因为您的 LOF 会更加稳定。


推荐阅读