首页 > 解决方案 > 如何从数据框中的列创建稀疏矩阵?

问题描述

嗨,我正在做一个在线教程,在运行部分代码时遇到了一些错误,我在编码方面相当新,有人可以帮助解决这个问题,请参见下面的代码:

代码:

customers = list(np.sort(grouped_purchased.CustomerID.unique())) # 获取我们的唯一客户

products = list(grouped_purchased.StockCode.unique()) # 获取我们购买的唯一产品数量 = list(grouped_purchased.Quantity) # 我们所有的购买

rows = grouped_purchased.CustomerID.astype('category', categories = customers).cat.codes

获取关联的行索引

cols = grouped_purchased.StockCode.astype('category', categories = products).cat.codes

获取关联的列索引

purchase_sparse = sparse.csr_matrix((quantity, (rows, cols)), shape=(len(customers), len(products)))

我得到的错误:


TypeError Traceback(最近一次调用最后一次)在

  3 quantity = list(grouped_purchased.Quantity) # All of our purchases
  4 

----> 5 行 = grouped_purchased.CustomerID.astype('category', categories = customers).cat.codes

6 # 获取关联的行索引

7 cols = grouped_purchased.StockCode.astype('category', categories = products).cat.codes

TypeError: astype() 得到了一个意外的关键字参数“类别”

标签: listtypescategoriessparse-matrix

解决方案


推荐阅读