python - Pandas TypeError:数据类型“”不理解
问题描述
我想将准备好的数据读入 Pandas。首先,对于对象等非数值型变量,pandas describe 方法会给出变量:'非空值个数'、'唯一值个数'、'最大频率变量个数'、'最大频率' . 为了直观地观察缺失情况,最后加上了“缺失值的比例”。这里的代码有上面标题中的问题。
import pandas as pd
lcvs=[]
lcvs.append(pd.read_csv('E:/chenln/Documents/python/ch3/project/LoanStats_2017Q3.csv',skiprows=0,header=1))
lcvs.append(pd.read_csv('E:/chenln/Documents/python/ch3/project/LoanStats_2017Q4.csv',skiprows=1))
lcvs.append(pd.read_csv('E:/chenln/Documents/python/ch3/project/LoanStats_2018Q1.csv',skiprows=1))
file=pd.concat(lcvs)
#三季度合并的文件写入到prj.csv
file.to_csv('E:/chenln/Documents/python/ch3/project/prj.csv',index=False)
data=pd.read_csv('E:/chenln/Documents/python/ch3/project/prj.csv',encoding="ISO-8859-1")
data.info()
#共有145个变量,38个是object类型
data.select_dtypes(include=['O']).describe().T.assign(missing_pct=data.apply(lambda x : (len(x)-x.count())/len(x)))
该错误的具体信息是:
>TypeError Traceback (most recent call last)
<ipython-input-9-8a0448befedd> in <module> <>
----> 1 data.select_dtypes(include=['0']).describe().T\
2 .assign(missing_pct=data.apply(lambda x : (len(x)-x.count())/len(x)))
谢谢你的热心帮助!
如果您想浏览所有代码信息,请访问以下网站: https://zhuanlan.zhihu.com/p/48504956
解决方案
推荐阅读
- postman - 转义或忽略邮递员变量
- ansible - 如何在ansible中使用命令行添加变量?
- php - Xdebug 2 与 Xdebug 3 - 代码覆盖率的差异
- kubernetes - Kubernetes API 容器不断死亡
- c++ - Xcode:致命错误:找不到“iostream”文件
- python - Python 是否对递归循环有内部限制?
- r - 即使不满足条件,是否有 R 函数可以保留所有行?
- thunderbird - Thunderbird:如何向文件夹的所有收件人发送邮件
- javascript - 使用溢出省略号Angular 7创建显示更多效果
- ruby-on-rails - 基于复选框输入的简单表单