python - 删除熊猫数据框中列与数据类型不匹配的行
问题描述
我有一个df
看起来像这样的数据框:
A B C
abc 10 20
def 30 50
cfg 90 60
70 str 50
xyz 75 56
我想摆脱数据类型不匹配的第 4 行
我的代码:
df = pd.read_csv(file_path+files, delimiter='\t', error_bad_lines=False)
df.dtypes
A object
B int64
C object
dtype: object
解决方案
如果你不知道你的专栏是什么 dtypes,我会说这不是一个微不足道的问题。
出于这个问题的目的,我假设您的 DataFrame 中只有字符串和数字类型。
v = df.apply(pd.to_numeric, errors='coerce').isna()
df[~((x.mean() >=.5) ^ x)].dropna()
A B C
0 abc 10 20
1 def 30 50
2 cfg 90 60
4 xyz 75 56
这里的想法是删除不共享大多数数据的 dtype 的行。
推荐阅读
- typescript - 如何使用 TypeScript 编译器 API 向 TypeScript 类添加新属性?
- neo4j - 从 Neo4j 结果集中获取特定标签列表的计数
- android - 为什么我不能让我的按钮变圆?
- vba - Word 表格单元格字符
- java - 第一位和最后一位数字之和
- user-interface - 移动设备的响应式水平菜单
- amazon-web-services - Amazon S3 - 通过引用者限制访问
- java - 如何根据扫描文件中的用户输入显示消息
- javascript - 如何根据公共属性的值从另一个对象数组的所有元素中过滤对象数组
- dynamics-business-central - Business Central AL 代码超链接方法