首页 > 解决方案 > KNIME 比较数据集

问题描述

您能否回答:- 因为我们使用 KNIME 来按照我们的要求运行我们的。在我们的工作流程中,我们比较了 2 个数据库中的客户数据,一个 oracle 和一个 Hive,然后我们想要报告有多少数据匹配,多少不匹配。所以现在我们想根据客户的位置对一些客户 ID 进行分组,以查看我们从哪个位置获得更多不匹配。你能告诉我我应该使用哪些节点来获取这种类型的自定义报告

标签: knime

解决方案


目前尚不清楚您要如何进行比较,但我认为您将需要Joiner节点。之后,您可以使用 GroupBy 节点使用GroupBy节点按位置计算不匹配,但在此之前,您应该使用例如规则引擎节点将连接器创建的缺失值转换为(如果原始数据集有有趣的列中缺少值,您应该在Joiner之前将它们更改为)和所有其他值到不同的值。


推荐阅读