python - 无法从多个数据框和列 python pandas 中获取百分比差异?
问题描述
我正在尝试以下方法来查找从一个数据帧到另一个数据帧的重复项,然后我需要获取它们之间总重复项的百分比。我在下面尝试过这个:
这第一个总数可以给我我的总数:
print('\n Compare: \n' + str(Ab.colB.isin(Op.colB).value_counts(dropna=True).pct_change().loc[False])+ ' Duplicates Found') #Comparing colB column
这对于百分比不起作用:Giving "ufunc 'add' did not contain a loop with signature matching types dtype('<U32'). 我认为这与我在 a 前面调用 str 的方式有关我的第一行代码然后没有将它应用到每个后续。但是当我这样做时,它不接受我的格式。
print('\nTotal duplciate Found:' + str(Ab.colB.isin(cs_.colB).value_counts(dropna=True).pct_change().loc[False]) + str(Ab.colB.isin(Op.colB).value_counts(dropna=True).pct_change().loc[False])
注意:最后通过添加 SeaBean 提到的附加 str 并以 ) 结束每个部分来找到工作。这现在留下了另一个问题。我的答案不是我所期望的:我得到 -0.6725XXXXX-0.9153xxxxx
我得到的是单独的部分百分比小数减去彼此,而不是实际将每个部分加在一起,然后是整行的百分比差异。
解决方案
推荐阅读
- matlab - 如何从字符串名称中获取数值(小数)
- python - 将文本文件中的数字数组读入numpy数组 - python
- r - 在热图的图例连续渐变色条周围绘制边框
- angular - 角度材料中的嵌套列表
- assembly - 为什么这些组装行会导致 QtSpim 崩溃?
- apache-kafka-streams - Kafka Streams 如何分配分区?
- twitter-bootstrap-3 - 轮播图像在不应该用于 Bootstrap 3.3.7 时会堆叠
- python - Pyqt5 与 pyqtgraph 构建两个图
- vim - 自定义 Vim 写入功能以制作备份副本
- awk - 是否有 INT_MIN 和 INT_MAX 的 awk 等效项?