首页 > 技术文章 > 数据挖掘------数据预处理之缺失值可视化

randy-lo 2021-02-03 09:26 原文

对于数据挖掘问题,经常遇到超过1000M的数据量,600多个特征,十万条数据,其中难免属性数据的缺失以及脏数据

数据预处理的过程,在特征选择之后往往进行缺失值和异常值的处理,缺失值的可视化非常直观地展示了缺失数据的结构。

1.未缺失数据

 

 

 2.构造缺失数据与可视化

 

 

 3.另外几种可视化方法,为特征选择做了足够的准备:

 

 

 

可视化的参考博客

https://blog.csdn.net/andy_shenzl/article/details/81633356

数据挖掘基本流程和入门级别的方法如下

 

推荐阅读