首页 > 解决方案 > Spark SQL vs Hive vs Presto SQL 在 Parquet 文件上进行分析

问题描述

我有数 TB 的数据以 Parquet 格式存储,用于分析用例。有多个大表也需要连接,并且查询量很大。该系统预计具有高度可扩展性。目前,正在评估 Spark SQL、Hive 和 Presto SQL。根据理论,一切似乎都符合要求。您能否说明一下差异以及上述用例应考虑的事项。Tableau 将用于在此之上进行可视化。

标签: apache-spark-sqlhiveqlpresto

解决方案


推荐阅读