首页 > 解决方案 > 从 S3 或 Azure 以编程方式将数据加载到 MemSQL 的最佳方法是什么?

问题描述

我必须将数据(以 CSV 或 TSV 的形式)从 Amazon S3 存储桶中的某个路径加载到一些 MemSQL 表中。将来可能需要从 Azure Blob 存储加载数据。我知道有两种方法可以做到:

以下是需要考虑的两种方法的优缺点:

请建议将数据加载到 MemSQL 表的最佳方法。另外,如果还有其他方法可以做到这一点,请告诉我(除了管道和加载器)。

提前致谢。

标签: javajdbcamazon-s3azure-blob-storagesinglestore

解决方案


MemSQL 管道非常适合您的工作负载。正如您所提到的,S3 和 Azure Pipelines 将在新文件可用时自动为您加载。当 Pipeline 不加载数据时,除了极少量的元数据之外,它不会使用系统资源。这是专门设计的,因此您无需手动设置 chron 作业来加载数据。如有必要,您还可以通过该STOP PIPELINE命令停止加载新文件。

information_schema 数据库中有一些表格,可让您查看所有管道的状​​态以及所有已命中的错误。具体来说,您可能希望查询PIPELINES_ERRORS表以获取错误。


推荐阅读