首页 > 解决方案 > 哪一种是从数据集中消除异常值的最佳方法?

问题描述

我想从数据集中查找并删除异常值。我使用 IQR 方法检测到异常值并使用箱线图显示它们,但无法删除它们。

请提出任何解决方案。

谢谢你。

标签: pythonpandasmachine-learningdatasetoutliers

解决方案


看看这个链接:

https://medium.com/@prashant.nair2050/hands-on-outlier-detection-and-treatment-in-python-using-1-5-iqr-rule-f9ff1961a414

在这里,他们使用 IQR 方法检测到异常值,然后使用下面的示例代码删除了特定的异常值样本。

sample.drop(sample[ (sample.Salary > u) | (sample.Salary < l) ].index , inplace=True)

推荐阅读