首页 > 解决方案 > Pandas TypeError:数据类型“”不理解

问题描述

我想将准备好的数据读入 Pandas。首先,对于对象等非数值型变量,pandas describe 方法会给出变量:'非空值个数'、'唯一值个数'、'最大频率变量个数'、'最大频率' . 为了直观地观察缺失情况,最后加上了“缺失值的比例”。这里的代码有上面标题中的问题。

import pandas as pd

lcvs=[]   
lcvs.append(pd.read_csv('E:/chenln/Documents/python/ch3/project/LoanStats_2017Q3.csv',skiprows=0,header=1))
lcvs.append(pd.read_csv('E:/chenln/Documents/python/ch3/project/LoanStats_2017Q4.csv',skiprows=1))
lcvs.append(pd.read_csv('E:/chenln/Documents/python/ch3/project/LoanStats_2018Q1.csv',skiprows=1))
file=pd.concat(lcvs)
#三季度合并的文件写入到prj.csv
file.to_csv('E:/chenln/Documents/python/ch3/project/prj.csv',index=False)

data=pd.read_csv('E:/chenln/Documents/python/ch3/project/prj.csv',encoding="ISO-8859-1")

data.info()
#共有145个变量,38个是object类型

data.select_dtypes(include=['O']).describe().T.assign(missing_pct=data.apply(lambda x : (len(x)-x.count())/len(x)))

该错误的具体信息是:

>TypeError                                 Traceback (most recent call last)
<ipython-input-9-8a0448befedd> in <module> <>
----> 1 data.select_dtypes(include=['0']).describe().T\
      2     .assign(missing_pct=data.apply(lambda x : (len(x)-x.count())/len(x)))

谢谢你的热心帮助!

如果您想浏览所有代码信息,请访问以下网站: https://zhuanlan.zhihu.com/p/48504956

标签: pythonpandas

解决方案


推荐阅读