apache-spark - 在数据块上运行 spark 时出错:构造函数 public XXX 未列入白名单
问题描述
我正在使用 azure databricks 并尝试从此页面运行一些示例 python 代码:https ://spark.apache.org/docs/latest/ml-pipeline.html
并得到了这个异常: py4j.security.Py4JSecurityException: Constructor public org.apache.spark.ml.classification.LogisticRegression(java.lang.String) 未列入白名单。
谢谢。立东
解决方案
使用启用凭据传递的高并发集群时,某些库方法会出现此错误。如果这是您的方案,则可以选择使用不同的集群模式。
py4j.security.Py4JSecurityException: ... is not whitelisted 当您访问 Azure Databricks 未明确标记为对 Azure Data Lake Storage 凭据直通群集安全的方法时,将引发此异常。在大多数情况下,这意味着该方法可以允许 Azure Data Lake Storage 凭据直通群集上的用户访问其他用户的凭据。
参考:https ://docs.azuredatabricks.net/spark/latest/data-sources/azure/adls-passthrough.html
推荐阅读
- url - 我的裸网址不能与“www”链接
- mongodb - 如何在猫鼬中使用 db.grantRolesToUser() 方法授予用户
- bash - Bash 变量合并到现有变量中
- github - 如何删除这些项目?
- json - Json 对象日志转到 ElasticSearch 中的多个记录,而不是使用 fluent-bit 的单个对象
- postgresql - 保持 postgres 的 docker 容器运行而不是启动
- flutter - flutter hot reload 其他页面
- javascript - Cheerio WebScraping 节点 JS
- wolfram-mathematica - 在 Mathematica 中自动生成不等式序列
- python - 在numpy数组中查找最大值的索引