python - 使用python在数据框中进行条件格式化
问题描述
我有一个熊猫数据框,我需要根据指定的条件对其进行分类。阈值是固定的,必须根据阈值的 8 种不同组合进行分类。
Threshold (A => 7, B = 3 or 4, C = between 22 - 27)
我尝试使用带有条件操作的 pandas 对数据进行分类,但它会产生误导性结果。
条件是:
1. class1=f[(f['A']>7.0)&((f['B']==3.0)|(f['B']==4.0))& ((f['C']>=22.0)&(f['C']<=27.0))]
2. class2=f[(f['A']>7.0)&((f['B']==3.0)|(f['B']==4.0))& ((f['C']<=22.0)&(f['C']>=27.0))]
3. class3=f[(f['A']<7.0)&((f['B']==3.0)|(f['B']==4.0))& ((f['C']>=22.0)&(f['C']<=27.0))]
4. class4=f[(f['A']>7.0)&((f['B']!=3.0)&(f['B']!=4.0))& ((f['C']>=22.0)&(f['C']<=27.0))]
5. class5=f[(f['A']>7.0)&((f['B']!=3.0)&(f['B']!=4.0))& ((f['C']<=22.0)&(f['C']>=27.0))]
6. class6=f[(f['A']<7.0)&((f['B']==3.0)|(f['B']==4.0))& ((f['C']<=22.0)&(f['C']>=27.0))]
7. class7=f[(f['A']<7.0)&((f['B']!=3.0)&(f['B']!=4.0))& ((f['C']>=22.0)&(f['C']<=27.0))]
8. class8=f[(f['A']<7.0)|((f['B']!=3.0)&(f['B']!=4.0))| ((f['C']<=22.0)&(f['C']>=27.0))]
我需要根据条件对数据框中的所有行进行分类。
解决方案
您的情况:您的数据框被调用f
并包含 3 列数值。这些列称为'A'
和。'B'
'C'
我建议通过创建布尔列并将它们组合以匹配您的类来做到这一点。可能有更多方法可以做到这一点,也有更优雅的方法。我认为这个解决方案很简单。本质上,您可以满足三个条件:
check_a = f['A'] >= 7
check_b = (f['B'] == 3) | (f['B'] == 4)
check_c = (22 <= f['C'] <= 27)
结合这 3 个检查将构建您的 8 个案例(~
否定布尔值,因此基本上翻转它们的值):
f['class_1'] = check_a & check_b & check_c
f['class_2'] = check_a & check_b & ~check_c
f['class_3'] = ~check_a & check_b & check_c
f['class_4'] = check_a & ~check_b & check_c
f['class_5'] = check_a & ~check_b & ~check_c
f['class_6'] = ~check_a & check_b & ~check_c
f['class_7'] = ~check_a & ~check_b & check_c
f['class_8'] = ~check_a & ~check_b & ~check_c
您的代码不起作用的原因之一是您正在检查列中的值是否'C'
都小于 22 并且大于 27。这永远不会是真的。
推荐阅读
- apigee - 防止 Google Apigee 中的重放攻击
- excel - Excel中的三层If-Then case语句
- regex - 如何使用 curl -O 下载不包括 url 参数的文件?
- postgresql - PostgreSQL:如果下一条语句是 RAISE EXCEPTION,则在函数中删除外部服务器将不起作用
- ios - 这个错误是什么意思 - 错误:捆绑失败:错误:ENOENT:没有这样的文件或目录,scandir'/Users/davidarebuwa/jaro/app/app/img'
- bash - 创建一个新的单字符快捷方式(如 ~)
- excel - 计算附加列的最后一行时出错
- swift - 在基类中实现协议方法,而子类实现其他协议方法会产生“冗余一致性”错误
- git - git svn 引入回车?
- jenkins - 无法使用下一代警告访问 Jenkins 管道中的记录问题