首页 > 解决方案 > 根据具有多列同时保留所有行的数据框中的值(每行的前 20 列)进行列选择

问题描述

我有一个由 pandas 制作的数据框,如下所示:

id-t    t1  t2  t3  t4  t5  t6  t7  t8  t9  t10 t11 t12
id1      2  4   2   0   5   4   4   4   5    5  5   5
id2      0  5   4   3   5   5   6   7   7    8  9   9
id3      2  0   5   4   4   3   5   5   6    7  7   9
id4      4  2   0   5   3   3   3   4   4    4  4   4
id5      2  0   2   4   2   4   4   5   5    6  6   7

我需要从中创建一个新的数据框,我想在其中保留所有行,而我只需要 5 列具有最高概率(值)。

order (highest to lowest)   id1 id2 id3 id4 id5
1                           t1  t4  t8  t3  t1
2                           t3  t5  t9  t5  t4
3                           t6  t6  t10 t9  t8
4                           t8  t7  t11 t7  t3
5                           t9  t8  t12 t12 t12

这意味着我需要知道每一行与其他列相比,哪些列具有例如 5 个最高值。列标签(标题)的顺序对我来说很重要,而不是确切的值。我希望我能正确解释。

标签: pandasdataframe

解决方案


推荐阅读