首页 > 解决方案 > 超时火花工人任务的oracle瓶颈

问题描述

我们在 spark 和 oracle DB 上有一个系统编程。我系统的瓶颈是当工作人员在数据库中插入或更新时,一些工作人员的执行者会出现超时错误。我们有 6 名工人,拥有 64G RAM 和 8 个内核。执行的数量等于worker的核心,每个执行者运行一个任务。oracle DB 有 16 个内核和 96G RAM。我们认为我们的 Spark 集群比 DB 系统更大,并且为大数据插入或更新(每个执行器可能同时插入或更新 7G 数据)是真的吗?另一个问题是像 Cassandra 这样的分布式数据库是解决这个瓶颈的方法吗?

标签: oracleapache-sparkcassandra

解决方案


推荐阅读