首页 > 解决方案 > 用证据权重替换名义变量的类别

问题描述

我有一个关于用权重证据替换名义变量的分类值的问题。我已经成功地计算了重量的证据,但是我没有用它们各自的重量证据替换分类值。

这是我的代码:

for i in range (26962):
    for j in range (202):
        if INDUSTRY_CD_3_preprocessing[i] == woe_INDUSTRY_CD_3[0]['Value'][j]:
            INDUSTRY_CD_3_preprocessing[i] = woe_INDUSTRY_CD_3[0]['WoE'][j]

INDUSTRY_CD_3_preprocessing 是一个包含名义变量值的熊猫系列。woe_INDUSTRY_CD_3 是一个元组,在索引 0 中包含一个数据帧,其中列Value用于分类变量的不同值,WoE用于相应的权重证据。名义变量有 202 个唯一值,INDUSTRY_CD_3_preprocessing 包含 26962 个名义变量值

标签: pythonlist

解决方案


我解决了我自己的问题:

您必须将熊猫系列转换为浮点数,因为重量的证据也是浮点数!如果你不这样做,你会得到一个包含 1 的 0 和其他整数的列表。


推荐阅读