python - 数据框填充子集
问题描述
我正在研究泰坦尼克号数据集。我创建了一个名称中带有标题的新功能(先生、夫人、硕士、博士……)。我用它来填充每个标题的中位数。
titanic_data.loc[titanic_data['Age'].isnull(), 'Age'] = titanic_data.groupby('Title')['Age'].median()[titanic_data['Title']]
我无法使用 Titanic_data['Title] 从重复的轴重新索引,如果我这样做
titanic_data.loc[titanic_data['Age'].isnull(), 'Age'] = titanic_data.groupby('Title')['Age'].median()['Mr']
它充满了先生头衔的中位数,有什么想法吗?
解决方案
你应该做什么transform
titanic_data['new'] = titanic_data.groupby('Title')['Age'].transform('median')
推荐阅读
- python - 绘制共享 x 值的三个函数
- linux - 如何在linux中的给定时间关闭firefox?
- javascript - react-native 构建错误(开发服务器返回响应错误代码:500)
- ios - 使用 Kingfisher 取消单个图像下载
- sql - 指定两个排序索引?
- email - Google Analytics(分析)测量协议命中 URL 中的 Mailchimp 合并标签
- ios - 线程 1:EXC_BREAKPOINT(代码=1,子代码=0x18407cb5c)
- ios - 避免两个相同的 SCNNode 之间发生冲突
- json - bash cvs 文件到 json 新文件
- java - 从可变长度的十六进制字符串中检索数字