首页 > 解决方案 > 使用 pandas 的 csv 值总和

问题描述

我想将第三列中的所有值相加,以在一个新的 csv 文件中得到结果,其中第一列和第二列使用熊猫,这认为效率更高。

可以加在一起的最大值在 0 到 2 之间

如果存在 0.5 ,1 或 2 以外的值或字符,则添加将被忽略

csv 文件示例:

https://pastebin.com/WwDWqU3U

encounterId|chartTime|11885|67187|6711|6711|6710|1356|1357|1358|1359|1360|1361|1362|1366|140|140

325|2014-01-01 00:00:00|0
325|2014-01-01 01:00:00|0|0|0
325|2014-01-01 02:00:00|0
325|2014-01-01 03:00:00|0|0|0
325|2014-01-01 04:00:00|0
325|2014-01-01 05:00:00|1
325|2014-01-01 06:00:00|0|0|0
325|2014-01-01 07:00:00|1|0|0.5|1
325|2014-01-01 08:00:00|0
325|2014-01-01 09:00:00|1|0|0
325|2014-01-01 10:00:00|0
325|2014-01-01 11:00:00|1|0|0
325|2014-01-01 12:00:00|0
325|2014-01-01 13:00:00|0|0|0.5|1
325|2014-01-01 14:00:00|0
325|2014-01-01 15:00:00|0

我在找什么:

323|2013-06-03 00:00:00|0
323|2013-06-03 01:00:00|1
323|2013-06-03 02:00:00|1.5
323|2013-06-03 03:00:00|1.5
323|2013-06-03 04:00:00|0
323|2013-06-03 05:00:00|0.5
323|2013-06-03 06:00:00|0
323|2013-06-03 07:00:00|3.5
323|2013-06-03 08:00:00|0.5

我试过没有熊猫它给了我一些奇怪的结果

标签: pythonpython-3.xpandascsv

解决方案


您可以只求和并设置参数axis = 1,如先前答案中所建议的那样


推荐阅读