python - 分类数据中的异常值?
问题描述
我无法找到在分类数据中查找异常值的解决方案。我的数据由行的组合组成。我想标记某些组合不同的异常值。在上面指定的问题中,我无法将数据聚类为非异常数据行,异常行由相同的频率组成。我的数据看起来像这样->
c1 c2 c3 c4
row1-> A B C ,D
row2-> A B C D,
row3-> A D C ,G
row4-> NU D E G,
row6-> NU D E X
请提出一个有效的逻辑来解决问题。我还尝试根据频率分布数据,但我无法分配阈值,因为我无法找到将数据视为异常值的值。提供一种查找阈值的方法也可以提供帮助。
解决方案
分类数据没有异常值检测方法。在这种情况下,这个概念毫无意义。你可能会这样想:
您有 10 个样本,其中 9 位女性和 1 位男性。您可能认为男性是异常值,这只是您样本的组成,而不是异常值。
为了存在异常值,必须对项目之间的距离进行度量。看看这个以获取更多信息。
请提出一个有效的逻辑来解决问题。我还尝试根据频率分布数据,但我无法分配阈值,因为我无法找到将数据视为异常值的值。提供一种查找阈值的方法也可以提供帮助。
一个解决方案可能是value_counts
你的列,这样你就有了每个元素的频率。
推荐阅读
- python-3.x - 如何在while循环中更新每次迭代的变量值?
- java - 列出名称中包含 6 位数字的文件夹
- python - 使用 Gerrit-python-api 包设置提交消息错误
- reactjs - 更改使用动画 API 的动态卡片平面列表的 ZIndex
- python - Keras 精度返回 0
- kubernetes-ingress - 如何为非 ssl 和 ssl 端口设置 AWS ALB 入口默认操作
- sql-server - Visual Studio 中的时间间隔
- c++ - 标准的意图是任何形式的“嵌套类型说明符后跟一个标识符”都可以称为限定ID
- php - 语法错误,PHP 脚本中出现意外的“endforeach”(T_ENDFOREACH)
- javascript - 我正在尝试制作一个 if 语句,对我的对象数组中的不同类型的值进行排序