首页 > 解决方案 > 将 Pandas 系列转换为分类

问题描述

我有一个只有唯一 id 的 Panda 系列“id”,它是对象的 dtype。

data_df.id.dtype

返回 dtype('O')

我正在尝试按照此处的示例从我的 df 创建一个稀疏矩阵:Efficiently create sparse pivot tables in pandas?

id_u= list(data_df.id.unique())
row = data_df.id.astype('category', categories=reviewer_u).cat.codes

我得到:

TypeError: data type "category" not understood

我不确定这个错误是什么意思,我也找不到太多关于它的信息。

标签: pythonpandas

解决方案


请尝试:

row = pd.Categorical(data_df['id'], categories=reviewer_u)

您可以使用以下方式获取代码:

row.codes

推荐阅读