首页 > 解决方案 > 有谁知道测试三角洲湖/阿帕奇冰山的数据集?

问题描述

我正在寻找一个(或多个)示例数据集来测试 Delta Lake 和 Apache Iceberg,但我找不到。

我想测试两者的 MERGE 功能并进行比较,但是无法通过一个小示例来衡量性能并定义哪个更好。

我想要一个带有从表的第一个版本开始的主键的数据集,以及带有更改的多个数据集(小或大),这样我就可以测试 MERGE。

如果有人可以帮助我,我会提前感谢。

标签: apache-sparkdatasetdelta-lake

解决方案


推荐阅读