python - 从具有两个级别的 MultiIndexed 数据框中选择第一个值
问题描述
我对 python 比较陌生,所以请原谅由于我的术语不好而可能引起的任何混淆。
无论如何,我目前坚持尝试为多索引数据帧的第 2 级的每个索引获取第一个值。df 有 2 个索引,级别 1 是“用户”,级别 2 是“试用”。'user' 和 'trial' 都是整数值,而 't' 是连续浮点值。
基本上我想为每个用户提取以下数据帧的第一个“t”值:df= dataframe in question。
我用过df['user'].unique()
and df['trial'].unique()
(在做之前df.set_index(['user','trial'])
)发现有 1040 个独立用户和 97 个独立试用版。主要问题是不是每个用户都有相同的唯一试用号(即,用户 1 有试用号 5,而用户 2 没有,依此类推)。
有没有办法获得这些值,然后在一个类似的数据帧 df2 中编译它们,它也被“用户”和“试用”索引?
提前致谢!
解决方案
df = df.reset_index()
df = df.drop_duplicates(subset=['user', 'trial'], keep='first')
df = df.set_index(['user', 'trial'])
(替换<column>
为包含要排序的值的列的名称)
推荐阅读
- c# - 每次按下按钮时,如何按顺序保存旧的数字变量?
- vim - leetcode 使用什么 vim 插件来自动关闭括号?
- android - Android - 在运行时加载和卸载库
- python - Cumulative Churn rate calculation using Date of a month - Date Issue is major
- android - 如何从 Google 帐户密码管理器 Android 应用程序获取登录名/密码?
- arrays - 如何在 ruby 的对象数组中插入一个对象?
- express - 在 highcharts 中的堆映射上单击事件显示数据
- c++ - 在 c++ 中的菱形问题中,为什么我们需要从子类中调用 grand_parent 构造函数?
- windbg - 找不到导出同步块
- python - python用其他嵌套字典更新嵌套字典