database-design - Presto vs Impala:架构、性能、功能
问题描述
您能否强调一下 2019 年两者在架构和功能上的主要区别?以及这些差异如何影响性能?
出于某种原因,这个出色的问题被标记为基于意见。
额外的问题:为什么亚马逊决定使用 Presto 作为 Athena 的引擎?它是否比 Impala 更好?
UPD
f PrestoDB 和 Impala 相同,为什么它们的硬件要求如此不同?Presto 要求 16 GB+ 的 RAM,而Impala 要求 128 GB+ 的 RAM。
解决方案
虽然技术架构、性能和功能可能是一个非常详细的主题,但我能想到的一些关键亮点(基于这两个引擎在过去这么多年的历程):
- Presto 总是在 Facebook、Netflix、Airbnb、Pinterest 和 Lyft 等类型的数据驱动公司的规模(PB 规模)上进行测试,但 Impala 可能没有那种大规模的部署(当然他们会有一些但那些故事在公众中并不为人所知)。
- 由于上述因素,Presto 始终拥有一个非常多样化且快速发展的社区,帮助构建了这个强大的引擎。
- Presto 非常接近 ANSI SQL 合规性,这有助于其被传统数据社区采用。
-Ashish Dubey (Qubole)