首页 > 解决方案 > 如何使用箱线图检测和删除数据集中的异常值?

问题描述

我想从股票预测数据集中检测和删除异常值。我必须取一列还是整个数据集?

标签: pythonjupyter-notebookdatasetseabornoutliers

解决方案


1.) 您应该选择要从中删除异常值的特定列。不是整个数据集。

2.) 如果您想使用箱线图去除异常值,您可以通过设置上下限值来使用四分位间距 (IQR)。也可以使用 pandas 轻松删除异常值。看看这篇文章https://datascience.stackexchange.com/questions/54808/how-to-remove-outliers-using-box-plot

注意:我发现这篇文章很有用。https://medium.com/datadriveninvestor/finding-outliers-in-dataset-using-python-efc3fce6ce32


推荐阅读