python - 如何使用箱线图检测和删除数据集中的异常值?
问题描述
我想从股票预测数据集中检测和删除异常值。我必须取一列还是整个数据集?
解决方案
1.) 您应该选择要从中删除异常值的特定列。不是整个数据集。
2.) 如果您想使用箱线图去除异常值,您可以通过设置上下限值来使用四分位间距 (IQR)。也可以使用 pandas 轻松删除异常值。看看这篇文章https://datascience.stackexchange.com/questions/54808/how-to-remove-outliers-using-box-plot
注意:我发现这篇文章很有用。https://medium.com/datadriveninvestor/finding-outliers-in-dataset-using-python-efc3fce6ce32
推荐阅读
- node.js - 如何将 NodeJs 应用程序部署到 azure Web 应用程序
- javascript - 在沉浸式模式下使用 Cordova 的 Android 中带有缺口的黑条
- javascript - 如何用连续的大写和小写字母分割字符串(以获得分子的原子数)?
- python - 去掉引号之间的引号
- c# - 实体框架扩展 bulkinsert 忽略设置超时
- python - 不能在 MQTT 客户端中调用 message.topic?
- xcode - 如何仅调试我在 Xcode 中编写的代码?
- java - JUnit 5 具有相同参数的多个参数化测试 - 迁移参数化
- tabulator - 在新版本 4.1 版本中,tabulator-cssClass 不起作用。那么如何将css类添加到html中以进行制表符转换?
- python - 我目前正在编写 Xpredict 函数,它是一般所有 keras 模型的 keras.predict function() 的包装器