pyspark - 如何在pyspark中加载databricks包dbutils
问题描述
我试图在 pyspark 中运行以下代码。
dbutils.widgets.text('config', '', 'config')
它给我一个错误说
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
NameError: name 'dbutils' is not defined
那么,有什么方法可以通过包含 databricks 包在 pyspark 中运行它,比如导入?
感谢您的帮助
解决方案
如 https://docs.azuredatabricks.net/user-guide/dev-tools/db-connect.html#access-dbutils中所述
根据您在 databricks 服务器上直接执行代码的位置(例如,使用 databricks notebook 调用您的项目 egg 文件)或使用 databricks-connect 从您的 IDE 执行代码,您应该如下初始化 dbutils。(火花是你的 SparkSession)
def get_dbutils(spark):
try:
from pyspark.dbutils import DBUtils
dbutils = DBUtils(spark)
except ImportError:
import IPython
dbutils = IPython.get_ipython().user_ns["dbutils"]
return dbutils
dbutils = get_dbutils(spark)
推荐阅读
- python - Python Ray 或多处理
- laravel - 我在我的 Laravel 学习项目中遇到错误,我在 Laravel 身份验证中遇到 npm run dev 问题我该如何解决这个问题?
- prebid.js - 仅从 Prebid Server 数据库中提取投标人详细信息以进行标头投标
- excel - 我正在尝试根据从另一个单元格中选择的内容在一个单元格中查找多个值并在下一张表中输出
- reactjs - 地理位置在 Chrome 的伊朗国家/地区无法在谷歌浏览器上运行
- tensorflow - 如何将检查点转换为 save_model_pb?在张量流 2.x 中
- git - 使用 Azure DevOps 管道自动合并 master 以开发分支
- python-3.x - plotly-express 图形颜色图例应仅显示整数值
- javascript - 光线投射器中的鱼眼效果
- c# - C# MVC - Html.RenderPartial("_somePartial", Model) 与 Html.RenderPartial("_somePartial") - 性能