python - 用证据权重替换名义变量的类别
问题描述
我有一个关于用权重证据替换名义变量的分类值的问题。我已经成功地计算了重量的证据,但是我没有用它们各自的重量证据替换分类值。
这是我的代码:
for i in range (26962):
for j in range (202):
if INDUSTRY_CD_3_preprocessing[i] == woe_INDUSTRY_CD_3[0]['Value'][j]:
INDUSTRY_CD_3_preprocessing[i] = woe_INDUSTRY_CD_3[0]['WoE'][j]
INDUSTRY_CD_3_preprocessing 是一个包含名义变量值的熊猫系列。woe_INDUSTRY_CD_3 是一个元组,在索引 0 中包含一个数据帧,其中列Value用于分类变量的不同值,WoE用于相应的权重证据。名义变量有 202 个唯一值,INDUSTRY_CD_3_preprocessing 包含 26962 个名义变量值
解决方案
我解决了我自己的问题:
您必须将熊猫系列转换为浮点数,因为重量的证据也是浮点数!如果你不这样做,你会得到一个包含 1 的 0 和其他整数的列表。
推荐阅读
- r - 使用 dplyr 创建列
- javascript - log4js 是否需要任何额外的代码才能在 Apache 服务器上工作?
- python - 如何在网站数据检索用例下理解python中的assert?
- python - 标记重复,同时忽略熊猫中的空值
- c++ - Qt - 实现自定义信号和插槽的正确方法
- java - Java - 舍入 99999999999999.9999
- javascript - Textarea html tag with support `css` code
- django - 如何从 Django 模板中的 JSON 以表格格式附加值?
- java - JavaFX 8 创建未修饰的 TextInputDialog,在全屏阶段表现为模态
- php - 如何在自定义命令中设置 cookie 并在中间件 Laravel 中获取