首页 > 解决方案 > 如何判断一个数据集是否受到另一个数据集的影响?

问题描述

我对这个数据挖掘很陌生。我有 2 个数据集,即人类发展指数和预期寿命指数,我想知道预期寿命数据集是否影响 HDI 数据集的价值。知道这一点的最好方法是什么?谢谢你

HDI 数据集如下所示: 在此处输入图像描述

预期寿命数据集如下所示: 在此处输入图像描述

标签: datasetdata-mining

解决方案


您将需要加入这两个数据集。

这可能涉及收集额外数据以填充缺失值,或丢弃仅存在于其中一个数据集中的一些数据点。因为连接键可能不同,您可能还需要在两个键之间构建映射。


推荐阅读