首页 > 解决方案 > 选择如何聚合稀疏矩阵中的重复索引

问题描述

当我们从 构造一个 scipy 稀疏矩阵(例如coo_matrix,csc_matrixcsr_matrix)时(data, (row_ind, col_ind)),默认情况下,重复的条目(row_ind, col_ind)被加在一起。例如:

from scipy.sparse import coo_matrix

row_ind  = [0, 0, 0, 2, 0, 0]
col_ind  = [0, 0, 0, 2, 1, 1]
data = [1, 1, 1, 1, 1, 1]

coo_matrix((data, (row_ind, col_ind))).todense()

matrix([[3, 2, 0],
        [0, 0, 0],
        [0, 0, 1]])

有没有办法指定另一个操作,例如minmaxmean不是sumsum_duplicates()此外,对于这些操作也有类似的方法会很有用。

标签: pythonscipysparse-matrix

解决方案


推荐阅读