首页 > 解决方案 > 在输入管道中使用 TensorFlow 特征列

问题描述

我目前正在寻找使用 TensorFlow 而不是使用 numpy 进行数据准备。我想我可以在我的输入管道中向我的解析函数添加一些元素。

当我浏览文档时,我遇到了功能栏。如果使用原始数据并且将数据传递给估计器,特征列似乎有助于我们进行数据清理。

我想知道是否有任何类似于特征列的函数可以对原始数据进行分桶。

我所说的分桶究竟是什么意思,假设我有一个像

[['num']  #the column headers is for representation only
 [10], 
 [20], 
 [30], 
 [40], 
 [50], 
 [60], 
 [70], 
 [80], 
 [90], 
 [100]] 

我想在上面的行中创建一个热门但在桶中,输出看起来像

[['10-50', '51-100'] #the column headers is for representation only
[   1   ,     0   ]
[   1   ,     0   ]
[   1   ,     0   ]
[   1   ,     0   ]
[   1   ,     0   ]
[   0   ,     1   ]
[   0   ,     1   ]
[   0   ,     1   ]
[   0   ,     1   ]
[   0   ,     1   ]]

是否有任何功能可以自动为我执行此操作?我知道有一个 tf.cond 函数可以用来实现它,但是实现起来可能很麻烦而且很长。我想知道它是否有任何即插即用功能

相关链接: 特征列如何在 tensorflow 中工作? https://www.tensorflow.org/guide/feature_columns

标签: pythontensorflowinput

解决方案


推荐阅读