首页 > 解决方案 > Presto vs Impala:架构、性能、功能

问题描述

您能否强调一下 2019 年两者在架构和功能上的主要区别?以及这些差异如何影响性能?

出于某种原因,这个出色的问题被标记为基于意见。

额外的问题:为什么亚马逊决定使用 Presto 作为 Athena 的引擎?它是否比 Impala 更好?

UPD

f PrestoDB 和 Impala 相同,为什么它们的硬件要求如此不同?Presto 要求 16 GB+ 的 RAM,而Impala 要求 128 GB+ 的 RAM

标签: database-designolapimpalaprestodistributed-database

解决方案


虽然技术架构、性能和功能可能是一个非常详细的主题,但我能想到的一些关键亮点(基于这两个引擎在过去这么多年的历程):

  1. Presto 总是在 Facebook、Netflix、Airbnb、Pinterest 和 Lyft 等类型的数据驱动公司的规模(PB 规模)上进行测试,但 Impala 可能没有那种大规模的部署(当然他们会有一些但那些故事在公众中并不为人所知)。
  2. 由于上述因素,Presto 始终拥有一个非常多样化且快速发展的社区,帮助构建了这个强大的引擎。
  3. Presto 非常接近 ANSI SQL 合规性,这有助于其被传统数据社区采用。

-Ashish Dubey (Qubole)


推荐阅读