python - 一旦 Apache Beam 支持 Python 3,tf.data 是否会集成到 tf.Transform 中?
问题描述
阅读有关 TFX、Kubeflow、Beam、Flink 和源源不断的 Apache 项目的信息,我越来越感到困惑。我很好奇 TensorFlow 团队打算将什么推广到用于训练 Keras 模型的规范 ETL API。
我目前对 in 的tf.data
支持感到非常满意,tf.keras
但非常缺少两件事:
- 用于标准化特征/目标的数据集缩减。
- 具有持久的每个元素缓存的完整数据集改组(例如,相当于使用 NumPy memmap 进行索引排列)。
我的预感是tf.data
存在的,因为tf.Transform
仅适用于 Python 2。一旦最终确定,未来会tf.data
怎样?它会被集成到tf.Transform
其中还是相反?最终将tf.data
获得上述功能,而与 Apache Beam 的状态无关?
TL;DR:什么是用于训练 Keras 模型的规范 ETL API?TensorFlower 能否阐明 TensorFlow 生态系统的计划以及它们应该如何结合在一起?
PS:这一切在tensorflow_io
哪里?tensorflow_datasets
他们似乎做了很多重新发明轮子而不是依赖tf.Transform
.
解决方案
推荐阅读
- python - fastapi - 从 main.py 导入配置
- python - 从 Amazon Ion 文件中提取“数据”
- functional-programming - 从 sml 中的整数对列表中返回偶数列表
- linq - 列表中不存在的asp.net核心sql
- swift - 不支持在 WKWebView 中加载 Twitter
- javascript - 为过期会话创建 redux 中间件重试功能
- r - 在 dyn.load(file, DLLpath = DLLpath, ...) 中安装“magick”时出错:无法加载共享对象
- javascript - 如何将自定义插件添加到 ckeditor4-vue?
- spring-retry - 弹簧重试断路器打开所有异常
- python - 在搅拌机中,我如何以编程方式在坐标/旋转处插入一个新的油脂铅笔对象(svg)