python - 如何使用python在列中加入csv和求和值
问题描述
我有一个这样的 csv 文件:
file1.csv
date item1 spec count
2019-03-29 book blue 10
2019-03-30 shirt green 11
...
2019-04-25 book blue 20
2019-04-26 shirt green 15
和另一个像这样的文件csv:
file2.csv
date item1 spec count
2019-03-29 book blue 5
2019-03-30 shirt green 4
...
2019-04-25 book blue 7
2019-04-26 shirt green 8
我想将该文件组合成这样:
fileResult.csv
date item1 spec count
2019-03-29 book blue 15
2019-03-30 shirt green 15
...
2019-04-25 book blue 27
2019-04-26 shirt green 23
有人可以帮我解决这个问题吗?
非常感谢您
解决方案
如果您的两个数据框具有相同的形状(相同数量的行、列)并且数据与您的示例一样对齐,我们可以简单地执行以下操作:
df1['count'] = df1['count'] + df2['count']
print(df1)
date item1 spec count
0 2019-03-29 book blue 15
1 2019-03-30 shirt green 15
2 2019-04-25 book blue 27
3 2019-04-26 shirt green 23
其他用途merge
:
final = df1.merge(df2, on=['date', 'item1', 'spec'])
final['count'] = final.pop('count_x')+ final.pop('count_y')
date item1 spec count
0 2019-03-29 book blue 15
1 2019-03-30 shirt green 15
2 2019-04-25 book blue 27
3 2019-04-26 shirt green 23
推荐阅读
- java - 比较Java中的时间对象
- marklogic - xdmp:diacritic-less 给出意想不到的结果
- odoo - 如何编写python代码来获取Odoo计算字段中特定时期之间所有销售订单的总和?
- postgresql - 如何在 Pgadmin4 中创建服务器?
- java - 使用 jodconvertor 将 doc 转换为 pdf 时出现连接拒绝错误
- javascript - FullCalendar 不通过 AJAX/JSON 呈现所有事件
- php - MVC:哪个 MVC 层对于这种方法是正确的?
- javascript - 循环遍历数组出错
- sql-server - 用于 XML 路径时如何将属性值添加到根元素?
- vba - VBA:将所有工作表文本转换为数字