首页 > 解决方案 > 生成稀疏向量的合成训练集

问题描述

我想在 python 中生成长度为 N 稀疏向量的数据集。我正在使用 scipy.sparse.rand 生成一个矩阵,如下所示 -

import numpy as np
import scipy.sparse as sps
x_train_unnorm = sps.random(N, m, density=d, format='coo', dtype=None, random_state=None).toarray()

m 这里是训练样本的数量,d 是非零元素的百分比。现在的问题是该命令生成一个稀疏矩阵,其中非零元素的总百分比为 d。我想确保每列的非零元素不超过 d%。有没有办法在不使用循环的情况下实现它?

标签: pythonnumpyscipy

解决方案


推荐阅读