scala - 使用 IntelliJ idea 的 Scala 工作表作为 Apache Spark 的 Scala REPL
问题描述
是否可以在 IntelliJ 中使用 Scala 工作表作为 Jupyter 笔记本的替代品。我遵循了这里提到的解决方案,但是它在本地而不是在远程集群上运行代码。我的主要挑战是 IntelliJ IDE 在我的笔记本电脑上本地运行,而 spark 集群在云中。如何让 IntelliJ 使用远程 SBT?
解决方案
如果您只是尝试以更具交互性/即席方式的教程来学习 Spark 编程和概念,那么您在帖子中提到的链接就是您将如何做到的。在这种模式下,您基本上是在模拟一个单节点 Spark 集群(即您的本地计算机),它既充当驱动程序节点,又充当执行程序节点(一体化)。
但是,在更真实的场景中,这并不是您在 ACTUAL Spark 集群上实际提交和运行 Spark 应用程序的方式。如果这就是你想要做的,你需要使用 Spark 提供的两种部署模式之一:客户端模式和集群模式。您将使用“spark-submit”命令行实用程序将已编译的 Spark 库(胖 JAR)作为 Spark 作业提交。更多细节在这里。
推荐阅读
- gstreamer - 通过 udp 流式传输网络摄像头卡住
- reactjs - React 状态和条件渲染
- javascript - 怎么输入值
- google-chrome-extension - IE 兼容模式下的 Edge 扩展
- laravel - Laravel 迁移包发布顺序
- python - 将列表中的计数元素合并为一个
- apache-flink - org.apache.flink.client.program.ProgramInvocationException: 主方法导致错误: No ExecutorFactory found to execute the application
- powershell - 需要使用 PowerShell 将包含文件列表的文件拆分为块 AG、HN ...
- python - Flask+OIDC+keycloak,keycloak用户会话删除端点给401未授权
- flutter - 你如何刷新或重建 Dart 中建议引用的缓存列表?