python - PYSPARK SQL ODBC 连接
问题描述
我已经有一个从 python 到 SQL 服务器的 ODBC 连接,我希望使用 pyspark 来运行查询,如何使用我当前与 pyspark 的连接。
谢谢
解决方案
你的问题很广泛,但这里有。您可以使用以下命令从 SQL 数据库中读取:
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
df = (
spark.read.format("jdbc")
.option("url", f"jdbc:{sql_flavour}://{ip}:{port};databaseName={database}")
.option("dbtable", "table_name")
.option("user", username)
.option("password", password)
.option("driver", "com.microsoft.sqlserver.jdbc.SQLServerDriver")
.load()
)
我想重要的是使用JDBC
格式,但指定你的driver
. 如果您遇到此问题,您可能需要下载特定的驱动程序/jar。希望这可以帮助。请尝试包含代码片段或您下次尝试的示例。
推荐阅读
- .net - Docker-compose 没有设置环境变量
- kubernetes - 用于服务的 GKE 自定义内部域
- python - 使用 S3 后端和用户权限提供媒体文件
- c++ - 类中的一个变量显示,但另一个不显示
- c# - 即使删除了 IISExpress 设置,ASP.NET Core 2.0 Web 应用程序仍会继续启动 IISExpress 而不是 Kestrel
- android - 如何使用 LiveData 将新项目添加到 Room (ORM) 并将其显示为 RecyclerView 中的第一个项目
- html - Arduino IDE 切换 url
- c# - IsNullOrEmpty' 在当前上下文中不存在
- sql - 使用分组查询自联接
- macos - 添加比例宽度约束时如何防止superview增长(OSX AutoLayout)