python - 如何将数据框命名为组中首次出现的函数
问题描述
如何循环数据框并创建新的数据框,以模式命名并仅包括该模式。
例如,对于这样的数据框:
df= pd.DataFrame({'X': ['hello', 'hi', 'hello', 'salut','hi', 'hi',
'hello', 'salut'], 'Y': [1, 4, 3, 2, 9, 0, 4, 3]})
X Y
0 hello 1
1 hi 4
2 hello 3
3 salut 2
4 hi 9
5 hi 0
6 hello 4
7 salut 3
我希望有
df_hi:
X Y
0 hi 4
1 hi 9
2 hi 0
df_hello:
X Y
0 hello 1
1 hello 3
2 hello 4
df_salut:
X Y
0 salut 2
1 salut 3
我的数据非常大,我想在 for 循环中自动命名新的数据框。
解决方案
您可以过滤现有的数据框,而不是创建新的数据框。
df[df['X'] == 'hello']
会给你你提到的数据框之一。
推荐阅读
- python - Apply multiple conditional level groupby
- python - 如何使用 Pandas 从 .txt 文件中解析表格
- amazon-web-services - 我用 nuget 导入的 AWS 库在哪里
- progressive-web-apps - 始终保持用户登录;本地应用程序?
- flutter - 自定义相机屏幕
- powershell - 具有多个过滤器和变量的 Get-ADUser
- javascript - 如何在 vue.js 中使用 for 循环显示 x 元素
- reactjs - 在 setState 中使用扩展运算符时附加的对象
- php - 如何使用嵌入式集合关系创建自定义 POST 操作?
- angular - Angular 8 + Rxjs 避免树链