首页 > 解决方案 > Featuretools 从多列创建索引

问题描述

我正在尝试使用 featuretools 中的entity_from_dataframe函数从数据框中创建一个实体。如果索引包含多于一列,有没有办法定义索引。我不确定是否需要列表、元组或其他数据结构。这是代码:

es=es.entity_from_dataframe(entity_id="credit",
                       dataframe=credit_df,
                       index=["ID1","ID2"]
                       )

它会产生以下关于哈希性的错误

类型错误:不可散列类型:“列表”

标签: featuretools

解决方案


您只能有一个变量作为您的索引。在您的情况下,您应该在数据框中创建一个新列,该列是您要使用的两列的串联

df["index"] = df["ID1"].astype(str) + "_" + df["ID2"].astype(str)

然后,您可以index在创建实体时用作索引。


推荐阅读