首页 > 解决方案 > Scikit Learn GridSearchCV 中的 n_jobs 是否有限制,它必须小于 cv 折叠的数量?

问题描述

我在具有 64 个内核的 hpc 集群上运行 GridSearchCV。我正在使用 10 个 cv 折叠和 n_jobs=40:

param_grid = [{'n_estimators': list(range(20, 200, 20)), 'criterion': ['mse', 'mae']}]
regcv = model_selection.GridSearchCV(RandomForestRegressor(), param_grid, cv=10, n_jobs=40, verbose=1)
regcv.fit(train , labels)

我注意到我的集群上只有 10 个进程在运行,即使我规定了 40 个。我还尝试使用 n_jobs=20 运行 GridSearchCV,并且我的集群上也只有 10 个进程在运行。

是否有可能拥有比 cv 折叠更多的 n_jobs?

标签: python-3.xscikit-learnparallel-processinggridsearchcv

解决方案


推荐阅读