tensorflow - 如何将缺失值传递给 feature_columns.bucketized_column()?
问题描述
我有一个Dataset
名为my_col
. my_col
是一个正数,我想将其转换为 5 个桶的单热编码向量:
fc_my_col = fc.indicator_column(
fc.bucketized_column(
fc.numeric_column('my_col'), boundaries=[1000, 2000, 3000, 4000]))
feature_columns = [fc_my_col]
...
inp_layer = fc.feature_columns.input_layer(features_batch, feature_columns)
my_col
当有值但某些记录没有值时,这很好用,在这种情况下,我希望所有 5 个存储桶指示器都为 0。
我可以为丢失的值填写默认值,但是由于bucketized_column
将整个数字范围都存储在存储桶中,所以我总是会落入其中之一。
我可以“忽略”一个桶吗?告诉bucketized_column
删除“越界”可能吗?
谢谢!
解决方案
default_value
如下图使用:
fc_my_col = fc.indicator_column(
fc.bucketized_column(
fc.numeric_column('my_col', default_value=0), boundaries=[1000, 2000, 3000, 4000]))
feature_columns = [fc_my_col]
推荐阅读
- sql-server - 是否应该在循环中设置来自消息队列激活的过程?
- r - 输出不会使 R 函数崩溃的参数的最小值
- javascript - 如何在保持响应的同时将一个页面嵌入到另一个页面中?
- adobe - 在 PDF 中,如何使用其他字段文本自动填充一个字段?
- python - Python:在 Numpy 数组赋值中使用等式运算符
- iphone - iPhone 应用程序由于测试版过期而无法运行?
- python-3.x - 如何定义从索引集到不定域集的函数?
- android - 为什么 .text 只适用于 onCreate ?至少在我的代码中:
- asp.net - 属性窗口中表单本身的事件迅雷
- mysql - MySQL group by + order by 慢得令人费解