首页 > 解决方案 > 如何使用 Keras model.fit 记录训练样本的 ID?

问题描述

尽管我设置了种子,但我目前有可重复性问题。我知道模型的初始化方式相同(通过检查model.save("initial.h5")withh5dump和 meld 进行检查)。

接下来我要检查训练样本是否以相同的顺序使用。因此,我想记录它们。

我通过训练

model.fit(dataset['train']['X'],
          dataset['train']['y'],
          epochs=cfg['model']['nb_epochs'],
          batch_size=cfg['model']['batch_size'],
          validation_split=cfg['model']['validation_split'],
          callbacks=[checkpoint], class_weight=cw)

我也可以加dataset['train']['id']。我想获得一个包含正在使用的 ID 列表的 txt 文件,例如,对于 32 的批量大小、765 的训练数据集长度和 5 个 epoch,我希望 txt 文件中有 765 * 5 = 3825 行,其中每个ID 大概出现了 5 次,前 32 个元素是第一批的 ID。

那可能吗?

标签: pythontensorflowkerasreproducible-research

解决方案


推荐阅读