numpy - TensorFlow 高级估计器的预处理数据集
问题描述
我来自 Scikit Learn 背景。我很难理解如何为 Tensorflow 预处理数据集。
我正在尝试使用 iris 数据集实现 svm。如果我有两个 numpy 数组,一个包含特征列表,另一个包含标签列表,我将使用哪些函数来创建分类器?
estimator = SVM(
example_id_column='example_id',
feature_columns=[real_feature_column, sparse_feature_column],
l2_regularization=10.0)
我假设 example_id_column 是
example_id_column = '0,1,2'
我不确定如何获得 feature_columns
解决方案
我认为最有效的方法是使用TFRecords
文件。有一个综合教程可用,它仍然是最相关的,也是。这还具有让您将更多管道定义为图形的一部分的优点,能够从源文件进行并发读取,并且不需要将数据集放入内存中。这绝对是值得的。
推荐阅读
- sql - 如何定位连接表中的行,该连接表与另一个表在其任何行中包含特定值?
- ruby-on-rails - 如何在 def 函数之外在 Rails 中使用请求?
- web-services - 使用流集微服务管道从 Rest Http url 获取参数以获取方法
- google-apps-script - I ask for help in running the script to send an email
- javascript - 如何验证令牌?
- javascript - 从 HTML 中找出准确的时间
- javascript - 桌面或移动设备上的 Safari 中不显示菜单图标
- javascript - 如何运行节点脚本
- c - 如何让 gcc 打印出可执行文件所需的共享库的确切路径
- javascript - 流类型 - 将函数对象映射到函数结果