首页 > 解决方案 > 张量流模型:.data-00000-of-00002 和 ,data-00001-of-00002 有什么区别?

问题描述

在存储一个 tensorflow ckpt 时,除了 .index、.meta 和 checkpoint 文件之外,还同时保存了两个“.data”文件:.data-00000-of-00002 和 .data-00001-of-00002。前者的尺寸远小于后者。我的问题是,为什么保存了两个数据文件,它们之间有什么区别?

标签: tensorflowmodelstore

解决方案


根据tensorflow官方页面:一个或多个分片(<prefix>-<global_step>.data-<shard_index>-of-<number_of_shards>)包含模型的权重,索引文件包含哪些权重存储在哪个分片中。分片的数量取决于您用于训练的机器数量。

因此,如果您在两台机器上训练模型,您将有两个带有后缀的分片:.data-00000-of-00002.data-00001-of-00002

您可能也想查看此网址

实例化tf.train.Saver时,您可以设置参数的值sharded(默认值为False)。sharded=True指示 Saver 对每台机器/设备的检查点进行分片。


推荐阅读