dataset - 如何判断一个数据集是否受到另一个数据集的影响?
问题描述
我对这个数据挖掘很陌生。我有 2 个数据集,即人类发展指数和预期寿命指数,我想知道预期寿命数据集是否影响 HDI 数据集的价值。知道这一点的最好方法是什么?谢谢你
解决方案
您将需要加入这两个数据集。
这可能涉及收集额外数据以填充缺失值,或丢弃仅存在于其中一个数据集中的一些数据点。因为连接键可能不同,您可能还需要在两个键之间构建映射。
推荐阅读
- javascript - 如何将js重写为java,(instanceof用法,替换重载)?
- apache-spark - PySpark + AWS EMR:df.count() 需要很长时间才能完成
- javascript - 将对象的新对象作为数组添加到数组中
- amazon-web-services - 在 Elastic Beanstalk 环境中为多容器配置设置 Dockerrun.aws.json
- servicestack - “dotnet tool update -g app”更新到不支持工作室的 0.0.76
- reactjs - 在 1 次分派时,在无限循环中分派将 redux 与 connect mapStateToProps 反应
- css - CSS中的文本下划线动画 - 最简单的方法?
- node.js - 无法将 JSON 文件中的多个对象插入我的 MongoDB,它只插入第一个
- sql-server - 使用与服务器“tcp:xx.xxx.xxx.xx”上的数据库“myDb”的连接时发生错误。SQL Server - 谷歌云
- python - 如何删除 tsv 行