首页 > 解决方案 > TensorFlow 高级估计器的预处理数据集

问题描述

我来自 Scikit Learn 背景。我很难理解如何为 Tensorflow 预处理数据集。

我正在尝试使用 iris 数据集实现 svm。如果我有两个 numpy 数组,一个包含特征列表,另一个包含标签列表,我将使用哪些函数来创建分类器?

estimator = SVM(
    example_id_column='example_id',
    feature_columns=[real_feature_column, sparse_feature_column],
    l2_regularization=10.0)

我假设 example_id_column 是

example_id_column  = '0,1,2'

我不确定如何获得 feature_columns

标签: numpytensorflowscikit-learn

解决方案


我认为最有效的方法是使用TFRecords文件。有一个综合教程可用,它仍然是最相关的,也是。这还具有让您将更多管道定义为图形的一部分的优点,能够从源文件进行并发读取,并且不需要将数据集放入内存中。这绝对是值得的。


推荐阅读