machine-learning - 没有标签的深度学习分类
问题描述
我必须参与一个关于分类的深度学习应用的研究项目。我有一个包含超过 35000 个特征的庞大数据集——这些都是很好的值,取自实验室。
这个想法是我应该创建一个分类器,它必须告诉给定一个新的输入,如果数据看起来是好的。我必须将深度学习与 keras 和张量流结合使用。
问题是数据没有分类。我将输入一个新列,其中 1 表示好,0 表示坏。问题是,鉴于整个训练集都很好,我如何才能确定一个条目是否不好?
我曾考虑过生成一些垃圾数据,但我不知道这是否是个好主意——我什至不知道如何生成它。你有什么建议吗?
解决方案
我将从异常检测开始。您可以首先使用 fe (堆叠)自动编码器减少特征,然后使用 sklearn 中的局部异常值因子:https ://scikit-learn.org/stable/modules/outlier_detection.html
您需要首先减少特征的原因是因为您的 LOF 会更加稳定。
推荐阅读
- c# - 在焦点丢失时禁用日期选择器文本框转换/验证
- reactjs - 获取新数组状态时反应类型错误
- intellij-idea - TornadoFX 未解决的 JavaFx
- python - 使用 OpenManipulator 和 MoveIt 生成和控制第二个手臂
- ios - 第一个表视图部分之前的边距
- php - PHP:在类 __constructor 中使用 file_get_contents() 是一种不好的做法吗?
- ios - SwiftUI - 如何创建带有标题和详细信息标签的列表?
- ios - NEPacketTunnelProvider 因不明确的错误消息而崩溃
- php - Laravel 工匠服务,重新加载 php.ini 文件
- android - 解析时间戳期间的 GSON 异常