tensorflow - Nightly TF / Cloned TFX - 如何管理 Kubeflow 的图像?
问题描述
当我访问我的 Kubeflow 端点以使用克隆的 TFX 上传和运行管道时,该过程在生成此消息的第一步开始挂起:
“此步骤处于待处理状态,并显示以下消息:ImagePullBackOff: Back-off pull image “tensorflow/tfx:0.14.0dev”,与创建的管道 yaml 文件中使用的图像相同。
我的总体目标是为 tfrecords 文件构建一个 ExampleGen,正如此处指南中所述。pip 中最新的 tfx 版本是 0.13,还没有包含必要的功能。出于这个原因,我安装 tf-nightly 并克隆/构建 tfx (dev-version 0.14)。这样做并安装一些额外的模块,例如 tensorflow_data_validation,我现在可以使用 tfx 组件创建我的管道,并包括一个用于 tfrecords 文件的 ExampleGen。我终于用 KubeflowRunner 构建了管道。然而,这会产生上述错误。
我现在想知道解决这个问题的适当方法。我想一种方法是自己使用指定版本构建图像,但也许有更实用的方法?
解决方案
TFX 还没有夜间映像构建。目前,它默认使用带有用于构建管道的库版本标记的图像,因此标记为0.14dev0
. 这是 HEAD 的当前版本,请参见此处:
https ://github.com/tensorflow/tfx/blob/a1f43af5e66f9548ae73eb64813509445843eb53/tfx/version.py#L17
例如,您可以构建自己的图像并将其推送到某处,并通过自定义管道的参数来
gcr.io/your-gcp-project/your-image-name:tag
指定管道使用此图像: https ://github.com/tensorflow/tfx/blob/74f9b6ab26c51ebbfb5d17826c5d5288a67dcf85/tfx/编排/kubeflow/base_component.py#L54tfx_image
推荐阅读
- python - 如何用 matplotlib.image.AxesImage 对象制作 matplotlib funcanimation 动画?
- machine-learning - 机器学习相关性
- unit-testing - 运行 php 单元测试时在 null 上调用成员函数 extension()
- function - 网站代码与 Excel Vlookup 功能相同
- python - 无法将 Pandas DataFrame 系列转换为整数?
- ios - 如何将我的 SWIFT 函数转换为泛型?
- java - 尽管我添加了 java 插件,但 Gradle 找不到 testCompile
- python-3.x - 如何从网络二进制图像字节制作一个 numpy ndarray?
- python - PyQT5中的Python实时子进程输出和进度条
- java - 在存储 Java 8 LocalTime 时,我应该在 Oracle 数据库中使用哪种数据类型?