首页 > 解决方案 > 无法从多个数据框和列 python pandas 中获取百分比差异?

问题描述

我正在尝试以下方法来查找从一个数据帧到另一个数据帧的重复项,然后我需要获取它们之间总重复项的百分比。我在下面尝试过这个:

这第一个总数可以给我我的总数:

print('\n Compare: \n' + str(Ab.colB.isin(Op.colB).value_counts(dropna=True).pct_change().loc[False])+ ' Duplicates Found') #Comparing colB column

这对于百分比不起作用:Giving "ufunc 'add' did not contain a loop with signature matching types dtype('<U32'). 我认为这与我在 a 前面调用 str 的方式有关我的第一行代码然后没有将它应用到每个后续。但是当我这样做时,它不接受我的格式。

print('\nTotal duplciate Found:' + str(Ab.colB.isin(cs_.colB).value_counts(dropna=True).pct_change().loc[False]) + str(Ab.colB.isin(Op.colB).value_counts(dropna=True).pct_change().loc[False])

注意:最后通过添加 SeaBean 提到的附加 str 并以 ) 结束每个部分来找到工作。这现在留下了另一个问题。我的答案不是我所期望的:我得到 -0.6725XXXXX-0.9153xxxxx
我得到的是单独的部分百分比小数减去彼此,而不是实际将每个部分加在一起,然后是整行的百分比差异。

标签: pythonpandasdataframe

解决方案


推荐阅读