首页 > 解决方案 > 训练期间未加载所有训练样本

问题描述

我只是从 NLP 开始。我从 tensorflow_datasets 加载了“imdb_reviews”数据集。

有 25000 个测试样本,但是当我运行时,我只训练了 782 个样本。如您所见,我没有使用batch_size,只是一次加载了整个数据集

这里

其他超参数是:

vocab_size = 10000
input_length = 120
embedding_dims = 16

谁能告诉我我做错了什么?

标签: pythontensorflownlptensorflow2.0tensorflow-datasets

解决方案


默认情况下,tf.keras.model 的 fit 方法会将批量大小设置为 32。 https://www.tensorflow.org/api_docs/python/tf/keras/Model

由于 32*782 = 25,024,它可能只是丢弃了最后一批。


推荐阅读