scala - 按分区从 Azure Blob 存储读取文件
问题描述
我设置了 azure blob 存储容器,如下所示
存储帐户--> 容器->YYYY/MM/DD/abc01.json
目录层次结构每天根据 Day 创建。这意味着每天都会创建一个新的“DD”目录,并在其中加载新文件。下个月也是如此。
如何从 scala 笔记本中读取此分区结构,它允许我根据我传递的根目录读取所有 abc*.json 文件。
例如:如果我想加载一个月的所有文件,我应该能够做到这一点。
对此的任何帮助表示赞赏
问候,
麦克斯
解决方案
您可以通过以下路径:
wasb://YOURDefaultContainer@YOURStorageAccount.blob.core.windows.net/YYYY/MM/*/abc*.json
您需要指定YYYY和MM值,并且由于要加载一个月的所有文件,因此可以使用通配符。
推荐阅读
- javascript - 如何在 Jest JS 中测试未处理的拒绝和已处理的拒绝
- scala - 可以像在 Python 或 R 中一样在 Scala 中使用列表执行切片吗?
- php - 如何在 Magento 2 的“订单和账户信息”部分显示订单总重量?
- ionic3 - 看起来这个项目中没有安装 @ionic/app-scripts
- sql - 在 SQL BETWEEN v1 AND v2 中选择多个范围
- excel - EXCEL 2016。如果 Sheet1 中的多个单元格与 Sheet2 中的多个单元格匹配,则突出显示行
- tsql - 合并 SSRS 上的行
- c++ - 在 pclose() 之前从 popen()ed FILE* 读取的输出是否完整?
- javascript - Javascript Date 以两种不同的方式表现
- android - USB 条码扫描器发送的值