首页 > 解决方案 > Python。计算数据框列值中的共现

问题描述

这是我的数据框:

df = pd.DataFrame({'c1': [1, 4, 7, 5, 6], 'c2': [2, 5, 1, 7, 8], 'c3': [3, 1, 2, 4, 6], 'c4': [3, 9, 5, 4, 8], 'c5': [1, 2, 3, 4, 5], 'c6': [2, 5, 1, 7, 8]})

数字代表产品代码(它们不是数字)。我正在寻找类似相关矩阵的东西来比较列的相似性(计数交叉点)。你能帮忙写一个循环计数所有列的相似代码吗?

样本输出:

C1 with c2 ... times, c3... times, c4... times, c5... times, c6... times
C2 with c3... times, c4... times, c5... times, c6... times
C3 with c4... times, c5... times, c6... times    
And so on

PS 我检查了重复项,但找不到相同的问题。

标签: pythonpandasdataframe

解决方案


推荐阅读