python - 如何在熊猫数据框中将重复项限制为 5 个?
问题描述
col1= ['A','B','A','C','A','B','A','C','A','C','A','A','A']
col2= [1,1,4,2,4,5,6,3,1,5,2,1,1]
df = pd.DataFrame({'col1':col1, 'col2':col2})
对于 A,我们有[1,4,4,6,1,2,1,1]
8 个项目,但我想在将数据框转换为 dict/list 时将大小限制为 5
输出:
Dict = {'A':[1,4,4,6,1],'B':[1,5],'C':[2,3,5]}
解决方案
pandas.DataFrame.groupby
与 一起使用apply
:
df.groupby('col1')['col2'].apply(lambda x:list(x.head(5))).to_dict()
输出:
{'A': [1, 4, 4, 6, 1], 'B': [1, 5], 'C': [2, 3, 5]}
推荐阅读
- javascript - 可以从父窗口访问响应代码吗?
- elasticsearch - ElasticSearch - 如何编辑文档数组中的字段
- node.js - 在 node js 中安装 gulp 时出错
- java - Java中哈希码的延迟初始化
- solr - 如何使 Solr 同义词与 KeywordTokenizerFactory 一起使用?
- hyperledger - 如何验证区块链/DLT 未被篡改?
- javascript - 在 Vue 中使用 AOS 库
- python - 在 docker 中生成 csv 的 python 脚本
- azure-service-fabric - 部署的包缺少配置和证书。激活遇到错误 - FABRIC_E_CERTIFICATE_NOT_FOUND
- html - 触发 css:hover 仅在其行高区域