scikit-learn - 如何获得 MLPRegressor 每次迭代的训练和测试分数?
问题描述
这个答案似乎正是我需要的,但对于回归器而不是分类器。
https://stackoverflow.com/a/46913459/9726897
我做了非常小的修改来修改 sascha 从链接提供的代码,如下所示。我认为将其用于我的 MLPRegressior 会相当简单......但我收到一条错误消息,我不知道如何解决任何帮助将不胜感激:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.neural_network import MLPRegressor
estimator_reg = MLPRegressor(
solver='adam',
activation='relu',
learning_rate='adaptive',
learning_rate_init=.01,
hidden_layer_sizes=[100],
alpha=0.01,
max_iter=1000,
random_state=42,
tol=0.0001,
early_stopping=False,
warm_start=True,
beta_1=0.7,
beta_2=0.98,
epsilon=0.0000000001,
verbose=10,
)
""" Home-made mini-batch learning
-> not to be used in out-of-core setting!
"""
N_TRAIN_SAMPLES = train_data.shape[0]
N_EPOCHS = 25
N_BATCH = 128
scores_train = []
scores_test = []
# EPOCH
epoch = 0
while epoch < N_EPOCHS:
print('epoch: ', epoch)
# SHUFFLING
random_perm = np.random.permutation(train_data.shape[0])
mini_batch_index = 0
while True:
# MINI-BATCH
indices = random_perm[mini_batch_index:mini_batch_index + N_BATCH]
estimator_reg.partial_fit(train_data[indices], train_labels[indices])
mini_batch_index += N_BATCH
if mini_batch_index >= N_TRAIN_SAMPLES:
break
# SCORE TRAIN
scores_train.append(estimator_reg.score(train_data, train_labels))
# SCORE TEST
scores_test.append(estimator_reg.score(test_data, test_labels))
epoch += 1
""" Plot """
fig, ax = plt.subplots(2, sharex=True, sharey=True)
ax[0].plot(scores_train)
ax[0].set_title('Train')
ax[1].plot(scores_test)
ax[1].set_title('Test')
fig.suptitle("Accuracy over epochs", fontsize=14)
plt.show()
我得到这个错误:
KeyError Traceback (most recent call last)
in () ---> 46 estimator_reg.partial_fit(train_data[indices],
train_labels
[indices])
........
KeyError: '[ 789 1493 353 33 1011 2029 1696 1649 653 1648 22 2477 2120 1000\n 2481 2448 1704 1962 2291 1995 2085 710 967 1839 461 504 1650 2166\n 584 513 676 1196 1621 2109 766 2012 1017 1636 1286 448 2049 1791 \n 141 1168 1249 159 2061 2456 431 1799 2249 2379 1169 1044 1010 120\n 2503 316 1070 671 1005 2164 975 2371 811 1555 1193 1316 487 1867\n 1262 1395 135 2224 32 1509 2132 997 263 233 1614 2317 1432 49\n 1251 2227 2536 1955 359 650 2287 792 1900 606 763 763 1837 742 965 \ n 1190 53 910 2486 738 103 103 1965 1965 1965 1965 1965 1084 123 1061 806 384 2261 384 2261 ] 不在索引中'
解决方案
我猜您的索引不在 (0, N_TRAIN_SAMPLES
) 范围内。
如果您删除或过滤了某些行,或者从开头包含的索引中的某些数字不在该范围内,则可能会发生这种情况。
尝试更改此行:
random_perm = np.random.permutation(train_data.shape[0])
进入这个:
random_perm = np.random.permutation(train_data.index.values)
推荐阅读
- scala - 用于读取非常规日期格式的 Spark udf
- azure-data-factory - 我们如何将一个表映射到 Azure 数据工厂中 sink DB 中具有不同列的多个表?
- openlayers-3 - 开放层图中的 POI 和方向路径
- visual-studio - 在没有 VSTS 任务的情况下部署 BizTalk 应用程序项目 (.btaproj)
- ios - 无法在 ios 中接收来自 react-native-firebase 的通知消息
- firebase - 意外令牌 mailTransport firebase 云功能
- mysql - 如果它们连接到一个对象,如何从一个表中删除 id 并从另一表中删除 id?
- python-3.6 - 如何在 python logging.basicConfig 中使用 TimedRotatingFileHandler 作为文件名?
- android - 无法在 android 设备中打开相机 - react-native
- python - 如何在 MIDI 文件中添加拍号?