首页 > 解决方案 > 异常检测python

问题描述

我有一个数据集,每个点有 7 个参数:

我想找到一种将所有异常值添加到 python 列表(而不是 plt.show GUI)的方法。我应该使用什么算法以及如何将结果作为 python 列表查看?感谢您的帮助:D

标签: pythonmachine-learningdatasetartificial-intelligenceoutliers

解决方案


Will Badr 的 Medium 上的这个页面是一个很好的资源 - https://towardsdatascience.com/5-ways-to-detect-outliers-that-every-data-scientist-should-know-python-code-70a54335a623。就使用哪种异常值检测算法而言,答案取决于数据的分布。我发现使用标准偏差和四分位数间距的距离来识别异常值是成功的。但是,这些方法比正态分布更有效,在我的场景中,我找到了将数据转换为正态分布而不影响结果的方法。


推荐阅读