deployment - h2o pojo on test data with extra columns than the model trained on and sometimes missing columns from the train dataset
问题描述
I have created my model POJO, I have to keep my columns in same order with same datatype when generating predictions using Hive UDF? what is the cleanest way to ignore extra columns and add the columns which are present in train data set but not in test data set, my all columns are either double or long.
解决方案
如果您使用 Easy 包装器,它会自动为您执行此操作。
如果您不使用 Easy 包装器,那么您需要发明相同的行为。
使用 Easy 包装器,新列将被忽略,缺失的列将被视为 N/A。
推荐阅读
- python - 如何使用python计算字典中的元素?
- android - How to enable hardware acceleration for Android Emulator in Windows Server 2019?
- php - How to get a random combination of rows that sum up to a specific value?
- dictionary - How toUppercase() one property of a list in kotlin with map?
- c# - 对 api 的发布请求适用于 Android,但不适用于 IOS。赛马林
- python - 如何让 Keras 只计算验证数据的某个指标?
- angular - 如何将搜索参数传递给 URL?
- python - 在 Python 的函数中正确使用 kwargs
- kotlin - channel.asFlux() 似乎在高并发情况下会导致死锁
- laravel - Laravel 中公共目录下的文件可以在不知道文件名的情况下查看吗?