首页 > 解决方案 > Python Dataframe groupby / 检查数据

问题描述

df 是具有列 ID、A、B 和 C 的数据框。如何在按列 ID 分组后检查 df 中这些列之间的数据并生成一个新的“Data_Check”列,其中列值更改的行表示 False 和否则为真(即行的值始终匹配)?

对于相同的列 ID 值,代码将比较需要跨行具有相同值的列 A、B 和 C。

例如

ID 一个 C
xxxx1 A1 B1 C1
xxxx1 A1 B1 C1
xxxx1 A1 B1 C1
xxxx2 A2 B2 C2
xxxx2 A2 B2 C3
xxxx2 A2 B2 C2
xxxx2 A2 B2 C2
xxxx3 A3 B3 C3

这将生成为输出

ID 一个 C 数据检查
xxxx1 A1 B1 C1 真的
xxxx1 A1 B1 C1 真的
xxxx1 A1 B1 C1 真的
xxxx2 A2 B2 C2 真的
xxxx2 A2 B2 C3 错误的
xxxx2 A2 B2 C2 真的
xxxx2 A2 B2 C2 真的
xxxx3 A3 B3 C3 真的

标签: pythonpandasdataframe

解决方案


推荐阅读