python - 在输入管道中使用 TensorFlow 特征列
问题描述
我目前正在寻找使用 TensorFlow 而不是使用 numpy 进行数据准备。我想我可以在我的输入管道中向我的解析函数添加一些元素。
当我浏览文档时,我遇到了功能栏。如果使用原始数据并且将数据传递给估计器,特征列似乎有助于我们进行数据清理。
我想知道是否有任何类似于特征列的函数可以对原始数据进行分桶。
我所说的分桶究竟是什么意思,假设我有一个像
[['num'] #the column headers is for representation only
[10],
[20],
[30],
[40],
[50],
[60],
[70],
[80],
[90],
[100]]
我想在上面的行中创建一个热门但在桶中,输出看起来像
[['10-50', '51-100'] #the column headers is for representation only
[ 1 , 0 ]
[ 1 , 0 ]
[ 1 , 0 ]
[ 1 , 0 ]
[ 1 , 0 ]
[ 0 , 1 ]
[ 0 , 1 ]
[ 0 , 1 ]
[ 0 , 1 ]
[ 0 , 1 ]]
是否有任何功能可以自动为我执行此操作?我知道有一个 tf.cond 函数可以用来实现它,但是实现起来可能很麻烦而且很长。我想知道它是否有任何即插即用功能
相关链接: 特征列如何在 tensorflow 中工作? https://www.tensorflow.org/guide/feature_columns
解决方案
推荐阅读
- javascript - 使用 Vuex 操作 Firebase 集合中的文档 [Vuex/Vuexfire]
- python - 向前填充等于值的列 - 熊猫
- ruby - 抓取 - 加载动态按钮
- c - 如何找到数组中小于或等于随机整数的最大数?
- android - 从手机应用向 REST API 发送 GET 请求
- gstreamer - 如何形成一个 gstreamer 管道来编码 tiff 文件中的 mp4 视频?
- symfony - Symfony KNP Snappy Bundle:进程已用信号“11”发出信号
- javascript - 在 JavaScript 中使用赋值进行选择性对象解构?
- python - 如何知道在 Pandas 数据框中存储为数组的列中元素的数量
- java - 如何将答案键与 java 中的答案进行比较?