sql-server - 将大型数据集从 SQL Server 转换为 Azure SQL 的方法?
问题描述
我有一个包含 5 亿行的大表,需要将其导入 Azure SQL 数据库。
通过将表转换为 .CSV 文件并将其作为表导入 Azure SQL 数据库,我能够成功导入较小的集合。但是,我必须导入的表很大并且想知道如何做同样的事情。
以下是导入小表的代码示例。
file_location = "/FileStore/tables/data.csv"
file_type = "csv"
# CSV options
infer_schema = "false"
first_row_is_header = "true"
delimiter = ","
# The applied options are for CSV files. For other file types, these will be ignored.
df = spark.read.format(file_type) \
.option("inferSchema", infer_schema) \
.option("header", first_row_is_header) \
.option("sep", delimiter) \
.load(file_location)
display(df)
permanent_table_name = "data"
df.write.format("parquet").saveAsTable(permanent_table_name)
解决方案
推荐阅读
- python - 如何从 gcp 存储桶中读取 keras .h5 模型
- julia - Julia 轮廓尺寸不匹配
- python-3.x - 在数据框中插入缺失的行
- android - 根据 Firebase 数据库更新回收站视图
- file - 在 COBOL 中写入顺序数据集使其成为无法访问的二进制文件
- python - 找不到 pytest 夹具 (pytest-bdd)
- rxjs - RxJS 运算符类似于 share(),但不会阻止辅助观察者/订阅者完成订阅
- kubernetes-helm - 如何通过helm operator更改Kafka集群broker中的Kafka.properties文件
- google-apps-script - 将文件夹 id 字符串传递给调用 DriveApp.getFolderById(id).getDateCreated() 的自定义函数时,Apps 脚本会引发错误;
- mfc - 如何在 MFC TreeControl 中绘制附加线?