python - 在数据块中并行化 Lime
问题描述
我正在尝试在 databricks 上并行化石灰框架,但无法这样做。我不知道如何,如果有人可以提供帮助,我如何发送对不同工人的每一个观察结果。
更明显的是来自石灰框架。
下面的代码:
import lime
import lime.lime_tabular
explainer=
lime.lime_tabular.LimeTabularExplainer(X_train,feature_names=train_columns,
class_names=['look_forward_Repatha'],verbose=True,
mode='regression')
--------------------------------
def calculate_in_parallel(line):
test_nparray = np.array(line)
exp = explainer.explain_instance(test_nparray,xgb_model.predict,
num_features=30)
return exp.as_list()
test_rdd = sc.parallelize(df_pred_X_test_skew_nohighcoll.values)
test_rdd = test_rdd.map(calculate_in_parallel)
test_rdd = test_rdd.collect()
解决方案
推荐阅读
- python - pandas - 检查工作日并替换重复项
- javascript - 如何使用 addeventlistner 在 javascript 中绑定事件?
- go - 如何使用自定义验证器验证结构数据类型?
- java - 如何使用 Bouncy Castle 创建与 OpenSSH 兼容的 ED25519 密钥?
- c# - 玩家在被传送/传送 Unity3d 后无法移动
- c# - 如何将匿名对象传递给具有多种泛型类型的泛型方法?
- r - 找出 R 中数据中的前 10 个 corr 特征
- xcode - RN ios 使用 Xcode 构建:为什么我收到这么多警告(构建时间)?
- reactjs - 我如何在反应原生输入中进行计算?
- abstract-syntax-tree - 如何表示抽象树中替换的 kleisli 组合