azure-synapse - 从 Azure Synapse spark notebook 连接到 SQL-Pool 表
问题描述
我正在寻找如何使用 Scala Spark 从另一个工作区的 SQL 池中读取 Azure Synapse 表,但没有成功(因为它显然是唯一的选择)。我在https://docs.microsoft.com/en-us/azure/synapse-analytics/spark/synapse-spark-sql-pool-import-export#use-pyspark-with-the-connector中发现了非常有用的示例,但是不适合我的情况。
我想知道是否可以将链接服务作为选项添加到以下查询?
%%spark
import com.microsoft.spark.sqlanalytics.utils.Constants
import org.apache.spark.sql.SqlAnalyticsConnector._
val df = spark.read.option(Constants.SERVER, "<SYNAPSE_WORKSPACE_NAME>.sql.azuresynapse.net").synapsesql("<DATABASE_NAME>.<DB_SCHEMA>.<DB_TABLE_NAME>")
像这样的东西:
.option(Constants.LINKED_SERVICE, "LINKED_SERVICE_NAME")
我找不到任何关于此的文档。
我的问题是我正在使用专用网络,两个突触工作区都通过专用端点连接,它们运行良好,因为我可以使用管道连接到 SQL 池。我的目标是使用 Spark Notebook 实现相同的目标。
出于某种原因,我收到了错误:
错误:com.microsoft.spark.sqlanalytics.exception.SQLAnalyticsConnectorException:com.microsoft.sqlserver.jdbc.SQLServerException:数据泄露到“DATALAKE_NAME.dfs.core.windows.net”被阻止。将目标添加到允许的数据泄露列表,然后重试。
但我不明白为什么它告诉我“数据泄露到 DATALAKE 被阻止?我试图访问 SQL-Pool,而不是数据湖,无论如何我也刚刚为数据湖创建了一个私有端点,但它仍然无法正常工作。
有谁知道这是否可能?
解决方案
推荐阅读
- c++ - 如何只显示有 5 个座位的汽车?
- python - 在 Python 中解析顶部行中的表/列和底部行中的记录的文本文件
- spring - Spring - 聚合 - 提要活动
- python - 将列表中的每个元素与另一个列表中的 2 个元素进行比较并提高代码效率
- javascript - Js - 将 scrollTop 转换为不透明度级别
- tensorflow - 图像数量翻倍
- javascript - 检查是否所有玩家都准备好了
- android - 使用角度在画布中绘制箭头
- python - 当使用 Python TensorFlow 输入形状 (53,))... 这个逗号是怎么回事?
- r - 合并数据框