python - 熊猫数据框逐行比较中的 F1 分数
问题描述
我希望有人能帮我解决这个问题——我是新手。我希望有一个 9 x 5000 的数据框,第一行看起来像这样:
Article IDInclude 0.3 1.4 1.5 1.6 1.7 1.9 2.0 2.3 2.5 3.2
0 4514313 False False NaN NaN 0.0 1.0 0.0 1.0 1.0 0.0 1.0
1 4514313 False False NaN NaN 1.0 1.0 1.0 0.0 NaN 0.0 1.0
2 8420104 True True 0.0 1.0 1.0 0.0 NaN 1.0 0.0 1.0 1.0
我想找到F1分数。每个“文章 ID”在数据集中出现两次,每个编码员一次,我想比较文章 ID 相同的行。有没有办法让第一次出现的文章 ID 为 y_true,第二次出现为 y_pred。
sklearn.metrics.f1_score(y_true, y_pred, *, labels=None, pos_label=1, average='binary', sample_weight=None, zero_division='warn')
Thank you!
解决方案
也许试试这个:
grouped = df.groupby('Article ID')
df_true = grouped.first().reset_index()
df_pred = grouped.last().reset_index()
推荐阅读
- swift - 不能在 swift 中用另一个协议扩展一个协议
- javascript - Javascript-如何在嵌套对象中获取属性值数组
- firebase - 如何在flutter中获取firestore数据
- java - Android App intellij Layout_marginBottom 添加到顶部
- sql - 使用标量值和 JSON 对象作为 JSON 值
- java - 尝试从 Java 中的方法返回 float[]
- php - 在拥有方找到一对多单向原则
- java - 对象的等于方法?
- django - Django HTML模板表格渲染
- java - 当包含区域信息时反序列化 LocalDateTime