首页 > 解决方案 > 如何将数据框命名为组中首次出现的函数

问题描述

如何循环数据框并创建新的数据框,以模式命名并仅包括该模式。

例如,对于这样的数据框:

      df= pd.DataFrame({'X': ['hello', 'hi', 'hello', 'salut','hi', 'hi',
      'hello', 'salut'], 'Y': [1, 4, 3, 2, 9, 0, 4, 3]})

        X       Y
   0    hello   1
   1    hi      4
   2    hello   3
   3    salut   2
   4    hi      9
   5    hi      0
   6    hello   4
   7    salut   3

我希望有

  df_hi:
           X    Y
       0   hi   4
       1   hi   9
       2   hi   0

  df_hello:
           X       Y
       0   hello   1
       1   hello   3
       2   hello   4

  df_salut:
           X       Y
       0   salut   2
       1   salut   3

我的数据非常大,我想在 for 循环中自动命名新的数据框。

标签: pythonpandas

解决方案


您可以过滤现有的数据框,而不是创建新的数据框。

df[df['X'] == 'hello']

会给你你提到的数据框之一。


推荐阅读