machine-learning - 验证准确率在训练准确率增加时波动?
问题描述
我有一个取决于历史数据的多分类问题。我正在尝试使用 loss='sparse_categorical_crossentropy' 的 LSTM。训练准确率和损失分别增加和减少。但是,我的测试准确度开始剧烈波动。
我做错了什么?
输入数据:
X = np.reshape(X, (X.shape[0], X.shape[1], 1))
X.shape
(200146, 13, 1)
我的模型
# fix random seed for reproducibility
seed = 7
np.random.seed(seed)
# define 10-fold cross validation test harness
kfold = StratifiedKFold(n_splits=10, shuffle=False, random_state=seed)
cvscores = []
for train, test in kfold.split(X, y):
regressor = Sequential()
# Units = the number of LSTM that we want to have in this first layer -> we want very high dimentionality, we need high number
# return_sequences = True because we are adding another layer after this
# input shape = the last two dimensions and the indicator
regressor.add(LSTM(units=50, return_sequences=True, input_shape=(X[train].shape[1], 1)))
regressor.add(Dropout(0.2))
# Extra LSTM layer
regressor.add(LSTM(units=50, return_sequences=True))
regressor.add(Dropout(0.2))
# 3rd
regressor.add(LSTM(units=50, return_sequences=True))
regressor.add(Dropout(0.2))
#4th
regressor.add(LSTM(units=50))
regressor.add(Dropout(0.2))
# output layer
regressor.add(Dense(4, activation='softmax', kernel_regularizer=regularizers.l2(0.001)))
# Compile the RNN
regressor.compile(optimizer='adam', loss='sparse_categorical_crossentropy',metrics=['accuracy'])
# Set callback functions to early stop training and save the best model so far
callbacks = [EarlyStopping(monitor='val_loss', patience=9),
ModelCheckpoint(filepath='best_model.h5', monitor='val_loss', save_best_only=True)]
history = regressor.fit(X[train], y[train], epochs=250, callbacks=callbacks,
validation_data=(X[test], y[test]))
# plot train and validation loss
pyplot.plot(history.history['loss'])
pyplot.plot(history.history['val_loss'])
pyplot.title('model train vs validation loss')
pyplot.ylabel('loss')
pyplot.xlabel('epoch')
pyplot.legend(['train', 'validation'], loc='upper right')
pyplot.show()
# evaluate the model
scores = regressor.evaluate(X[test], y[test], verbose=0)
print("%s: %.2f%%" % (regressor.metrics_names[1], scores[1]*100))
cvscores.append(scores[1] * 100)
print("%.2f%% (+/- %.2f%%)" % (np.mean(cvscores), np.std(cvscores)))
结果:
解决方案
你在这里描述的是过度拟合。这意味着您的模型会不断学习您的训练数据并且不会泛化,或者说它正在学习您的训练集的确切特征。这是您在深度学习中可以处理的主要问题。本身没有解决方案。你必须尝试不同的架构、不同的超参数等等。
您可以尝试使用欠拟合的小模型(即训练 acc 和验证的百分比较低)并不断增加您的模型,直到它过拟合。然后,您可以使用优化器和其他超参数。
更小的模型是指具有更少隐藏单元或更少层的模型。
推荐阅读
- swift - 如何更改 SwiftUI 中的 PickerStyle,例如 Embed in Form,但静态且不可滚动?
- google-chrome-extension - 在谷歌浏览器扩展中,第一次调用 chrome.identity.getAuthToken() 获取有效令牌,但第二次调用返回错误“用户未登录”?
- java - Java Streams - 按两个标准求和结果分组
- unity3d - 购买按钮的重定向脚本
- python - withColumn 中的用户定义函数仅调用一次,而不是每个 DF 行
- c++ - C++ 结构化绑定不适用于 bitset
- delphi - TRttiContext GetTypes 找不到我的类型
- python - 如何让 pylint 识别模拟的方法成员?
- javascript - 模态框关闭后如何在屏幕上显示两个图像?
- docker - 如何取消设置在运行时设置的 ENV 变量