h2o - 如何在 H20 中将枚举数据类型转换为数字
问题描述
我已将我的数据集导入到 h2o 流中,我有一列是分类类型,我想将其转换为数值数据类型。
如果我使用熊猫来完成这项任务,我会这样做,
df['category_column'] = df['category_column'].astype('category')
df['category_column'] = df['category_column'].apply(lambda x: x.cat.codes)
如何在水流中做到这一点,
我试过跟随,
- 在解析数据时,我将数据类型从枚举更改为数字,但数据显示
·
如下。 - 我尝试
convert to numeric
了选项,但它没有按我的意愿工作。
我不知道我是否朝着正确的方向前进。请帮我解决这个问题。
按照建议更新问题:
为什么 GLM 强迫我使用数值列?
评估单元格时出错
我的数据集如下所示:
当我使用 GLM 构建模型时,I
我的 response_column 是否出现以下错误
使用 opts {"model_id":"glm-e2ed0066-636c-4c71-bf8... 调用 POST /3/ModelBuilders/glm 时出错
错误消息:GLM 模型的非法参数:glm-e2ed0066-636c-4c71-bf8c-04525eb05002。详细信息:字段错误:_response:回归需要数字响应,得到分类。欲了解更多信息,请访问:http: //jira.h2o.ai/browse/TN-2
解决方案
如果您使用的是 H2O 的 python api,您可以使用.asfactor()
例如将数字列转换为枚举df['my_colummn'] = df['my_colummn'].asfactor()
在导入数据集后的流程中,您将在每个列名称旁边看到一个数据类型下拉菜单,您可以通过enum
从下拉菜单中选择将数据类型转换为枚举。您也可以在查看数据时解析数据集后执行此操作;每行中有一个超链接,您可以单击该超链接将数据类型从数字转换为枚举。
有关详细信息,请参阅文档:http: //docs.h2o.ai/h2o/latest-stable/h2o-docs/flow.html#parsing-data
推荐阅读
- javascript - 如何在真实浏览器中打开外部链接而不是 TWA 中的应用内浏览器
- python - ValueError:与 Series 不兼容的索引器 - 尝试修复值
- django - AttributeError 后恢复迁移后的 ProgrammingError
- apache-kafka - SMT 通过连接器配置创建 kafka 连接器字符串分区键
- python - 是否有通过 CoinGecko API 安全检查的解决方法?
- javascript - 对数组进行排序并将元素添加到该数组索引中的特定位置
- android - (jetpack compose) androidx.compose.runtime.internal.ComposableLambdaImpl 无法转换为 kotlin.jvm.functions.Function0
- sql - 如何使用 FROM 子句中的 CASE 语句来决定使用哪个表来获取 Oracle 中的数据?
- python - 值错误:数据帧的真实性不明确(将掩码数组转换为数据帧)
- ruby-on-rails - 创建允许用户关注多种记录的关系