python - 在 GCP 中的 Jupyter Notebook 上不断出现“内核重启”
问题描述
在谷歌云平台上使用 Hadoop Dataproc-Clusters 我不断收到消息“内核正在重新启动,内核(...)似乎已经死亡。它将自动启动”,并丢失了我在 jupyter 笔记本中的所有计算。我真的没有看到这些错误背后的任何模式,繁重的计算(> 10M 行的熊猫数据帧)是我能识别的唯一驱动程序。使用以下配置设置集群:
gcloud dataproc 集群创建 cluster-v1
--region europe-west1
--zone europe-west1-b
--subnet datascience
--no-address
--scopes 'https://www.googleapis.com/auth/cloud-platform'
--enable-component-gateway
--optional-components ANACONDA,JUPYTER
--bucket xxx-datascience
--image-version 1.5-debian10
--num-workers 3 --worker
-machine-type c2-standard-16
--worker -boot-disk-size 500
--master-machine-type c2-standard-16
--master-boot-disk-size 500
--gce-pd-kms-key XXX
--project ssc
知道是什么触发了这个错误吗?
解决方案
推荐阅读
- python - 有什么改进这个功能的技巧吗?希望减少约 5-10 行
- javascript - Highchart 不会使用 Gridstack 调整大小
- r - 计算数据框的一行,另一行计算 R 中的回报
- gatling - 如何在 Gatling 中使用 tryMax 获取空白属性,注销并重新开始迭代?
- ios - 如何从 HealthKit 中获取与 Health App 的值相同的静息能量值?
- python - 尝试更改 RTSP 视频流的分辨率
- sql - 表中具有 NULL 值的第一列
- javascript - 如何在.on jquery中锁定/设置/阻止变量
- django - Django rest 模型 m2m 顺序存储
- javascript - InvalidSelectorError:无效选择器:无法使用 xpath 表达式定位元素