python - 造纸厂 PySpark 支持
问题描述
我正在寻找一种方法来轻松执行 Jupyter Notebooks 的参数化运行,并且我找到了 Papermill 项目(https://github.com/nteract/papermill/)
这个工具似乎符合我的要求,但我找不到 PySpark 内核支持的任何参考。
造纸厂执行是否支持 PySpark 内核?
如果是,是否需要进行一些配置才能将其连接到 Jupyter 使用的 Spark 集群?
在此先感谢您的支持,马蒂亚
解决方案
Papermill 将使用 PySpark 内核,只要它们实现了 Jupyter 的内核规范。
配置您的内核将取决于所讨论的内核。通常这些从 spark.conf 和/或 spark.properties 文件中读取,以配置 Spark 的集群和启动时间设置。
推荐阅读
- firebase - ContentType 和元数据在存储写入规则中授予权限被拒绝
- interface - 如何将我的界面编码语言更改为英语
- android - 在 Android 11 上直接从内存访问文件
- python - 为什么我的 MatPlotLib 上的色标是向后的?
- python - 如果行中的项目满足列之间的条件,则附加到新的 df
- visual-studio-code - 在 vscode 片段中访问当前 git 分支
- javascript - 角度动画布局偏移
- excel - VBA 中的自动筛选和对象/应用程序定义错误的问题
- python - Python SQLAlchemy Flask Sqlite 只能从“python crud.py”打开数据库。在应用程序运行时导入时,它无法打开数据库
- laravel - 获取嵌套的 Laravel 用户数据