首页 > 解决方案 > 进行预测时是否需要将因子变量转换为数值?

问题描述

我有一个数据,其中 2 个变量是因子变量。第一个是“频率”,它有 4 个值 - Mly、Qly。海莉和伊莉。第二个是类型,它的值有 Trad、Ulip、Term 和 Pension。是否建议将这些变量转换为数字,例如将值 1 分配到 4 并进行预测?

我是数据科学的新手,因此问题

标签: r

解决方案


我认为你最好保留分类变量,不要将它们转换为数字。例如,R 中的回归包能够正确管理因子变量(即使没有定义虚拟变量)。此外,当您进行逻辑回归时,响应变量必须是分类的。


推荐阅读