tensorflow - 张量流模型:.data-00000-of-00002 和 ,data-00001-of-00002 有什么区别?
问题描述
在存储一个 tensorflow ckpt 时,除了 .index、.meta 和 checkpoint 文件之外,还同时保存了两个“.data”文件:.data-00000-of-00002 和 .data-00001-of-00002。前者的尺寸远小于后者。我的问题是,为什么保存了两个数据文件,它们之间有什么区别?
解决方案
根据tensorflow官方页面:一个或多个分片(<prefix>-<global_step>.data-<shard_index>-of-<number_of_shards>
)包含模型的权重,索引文件包含哪些权重存储在哪个分片中。分片的数量取决于您用于训练的机器数量。
因此,如果您在两台机器上训练模型,您将有两个带有后缀的分片:.data-00000-of-00002
和.data-00001-of-00002
您可能也想查看此网址。
实例化tf.train.Saver
时,您可以设置参数的值sharded
(默认值为False
)。sharded=True
指示 Saver 对每台机器/设备的检查点进行分片。
推荐阅读
- python - python 正则表达式意外匹配组
- java - 在Java PriorityQueue中,为什么queue[n]的children是queue[2*n+1]和queue[2*(n+1)]?
- reactjs - 如何在 React 中使用页面作为背景
- c# - Web dash 到 .exe
- python - 如何在 OPENCV 上将质量(照明、对比度、亮度等)从一张图片复制到另一张图片?
- flutter - 在列中颤动 z-index
- batch-file - 我可以使用变量批量提取子字符串吗?
- r - 保留用 `geom_text()` 绘制的字符串的尾随零
- jakarta-mail - 有没有办法防止使用 javamail 发送的电子邮件被自动转发?
- python - 在 conda 环境中在 Raspberry Pi 4 上安装 pandas 时出错