machine-learning - 是一种热编码没有虚拟陷阱
问题描述
在一个热编码器中有一种叫做虚拟陷阱的东西,即当我们用 3 个类别对分类列进行编码时,例如 a、b 和 c,然后使用一个热编码器我们得到 3 个类别,例如 a、b 和 c 列,但是当我们使用 get_dummies 我们得到 2 列而不是 a,然后 b 从虚拟陷阱中保存。是一种暴露于虚拟陷阱的热编码,或者它会处理它。我对吗?哪一个是虚拟陷阱的保存?还是可以将两者与我们的删除列一起使用,我将数据集用于许多算法。
寻求帮助。提前致谢。
解决方案
OneHotEncoder
不能直接处理字符串值。如果您的标称特征是字符串,那么您需要首先将它们映射为整数。
pandas.get_dummies
有点相反。默认情况下,它只将字符串列转换为 one-hot 表示,除非指定了列。
推荐阅读
- python - 提交表单时,Django自动为外键赋值?
- python - 如何解决:ModuleNotFoundError:没有名为“google.colab”的模块
- javascript - Discord Bot 应用程序无法启动
- c# - ZXing QrCode 渲染器异常与 .Net Core 2.1
- java - 使用页眉和页脚将 HTML 转换为 PDF
- python - 如何将python列表制作成html表格
- android - 错误:任务“:app:transformClassesWithPreJackPackagedLibrariesForDebug”执行失败
- r - 当 r 中的响应为 0 或 1 时,如何计算随时间的时间变化
- firebase - Firebase - 用于帐户管理功能的不同网址
- python - 如何区分点云中的健康树点和枯木点?