python - 匿名熊猫数据框列
问题描述
假设,我有以下数据框。
Person_info
(Bob, 2)
(John, 1)
(Bek, 10)
(Bob, 6)
我想通过保持他们的价值来匿名。
Person_info
(Person 1, 2)
(Person 2, 1)
(Person 3, 10)
(Person 1, 6)
我在这里有简单的匿名方法,但它无助于我想要得到的东西。
有人可以在 Pandas Python 中提供帮助吗?
解决方案
按照这个问题,您可以使用strip()
andsplit()
方法:
out=df['Person_info'].str.strip('()| ').str.split(',',1,expand=True)
然后factorize()
按照这个答案使用方法:
out[0]='Person' + pd.Series(pd.factorize(out[0])[0] + 1).astype(str)
最后使用agg()
方法:
df['Person_info']=out.agg(tuple,1)
输出df
:
Person_info
0 (Person1, 2)
1 (Person2, 1)
2 (Person3, 10)
3 (Person1, 6)
推荐阅读
- php - 活动菜单,但在 secon lvl wordpress
- excel - 对值求和,直到列中的下一个空白(每个空白之间的变量数),然后对空白之间的每个集合重复过程
- algorithm - 如何在规则引擎中实现循环?
- ibm-cloud - 访问策略或 IAM 访问以在 IBM Cloud 中创建 VM
- php - php会话值最小为一个值
- spring - Spring Batch 分解现有大型 ItemReader 的正确方法
- oauth - 有没有办法在 PWA 中打开 oauth 的外部页面,而不打开浏览器并仍然维护清单文件?
- sql - 使用查询结果填充临时表时出错
- python - 如何从文件夹中选择随机照片
- python - 使用 BeautifulSoup 抓取多个网站