python - 在两个excel表中匹配数据,并存储匹配的数据
问题描述
假设我有两张 Excel 表格。命名为fruits和fruitsDetail。
fruits.xlsx fruitsDetail.xlsx
**Name** **Name height weight** circumference
apple apple 25cm 50g 10cm
banana apple 35cm 60g 10cm
orange banana 15cm 20g 7cm
banana 24cm 66g 6cm
.... orange 45cm 60g 20cm
orange 36cm 76g 20cm
orange 88cm 100g 30cm
.......
我一直在使用jupyter notebook 和 pandas
import pandas as pd
df = pd.read_excel(open(r'C:\Users\fruits.xlsx','rb'))
mf = pd.read_excel(open(r'C:\Users\fruitsDetail.xlsx','rb'))
现在我想按周长保存数据...输出如下在单独的 excel 表中
name circumference weight
apple 10cm 50g,60g
banana 7cm 20g
banana 6cm 66g
orange 20cm 60g,76g
orange 30cm 100g
解决方案
据我了解,您想对权重列进行字符串聚合。对于每个名称,圆周实例。数据已经全部存在于 mf 数据框中,因此不需要合并它。像下面这样的东西应该可以工作:
agg_df = mf.groupby(['name','circumference'])['weight'].apply(','.join).reset_index()
agg_df.to_excel("newoutput.xlsx")
推荐阅读
- visual-studio-code - 如何从集成的 vs-code 终端复制所有文本?
- android - 在 Android 上通过生物识别或应用密码保护私钥
- reactjs - 如何用 React Native Animate 动画,执行回调函数,然后按顺序动画?
- python - Python OOP:在类之间传递值。对象和实例
- node.js - NestJS 地址已在使用 :::3000
- git - 我无法下载和上传我的 react native 项目,因为 .git 文件太大了
- c - 查找前 N 个回文数的 C 程序不打印任何内容
- sql - 使用 oracle 获取过去 12 个月的计数及其差异
- typescript - 在 TypeScript 中推断泛型函数类型
- python - python 脚本的 mpirun 未按预期运行