r - 对于初学者来说,度量和非度量 MDS 有什么区别?
问题描述
我对数据科学还很陌生,想用简单的话(比如教你的祖母)知道度量和非度量多维缩放之间的区别是什么。
我已经用谷歌搜索了 2 天并观看了不同的视频,并且无法完全理解人们用来描述差异的一些术语,也许我缺乏一些基本知识,但我不知道在哪个领域,所以如果你在解决这个问题之前,我应该对我应该有一个深刻的了解有一个想法,我会很感激你的建议。这是我所知道的:
多维缩放是一种减少维度的方法,以便能够以更友好的方式可视化或表示数据。我知道 MDS 有几种方法,如公制和非公制、PCA 和 FA(也许 FA 是 PCA 的一部分,我不确定)。
我试图应用这个的例子是一组数据,显示不同的城市和与这些城市相关的属性。例如,对于 1-7 的分数(1 最低 - 7 最高),这是每个城市的分数和相应的属性。
**Clean** **Friendly** **Expensive** **Beautiful**
柏林--------- 4 --------- 2---------------- --------5------------6
日内瓦---------6 --------- 3----------------- ------7------------7
巴黎------------ 3 --------- 4------------- ---------6-------------7
巴塞罗那----- 2 --------- 6--------- --3-------------------------4
我如何知道我应该使用公制 MDS 还是非公制 MDS。是否有一般的经验法则或简单的逻辑可供我在不深入技术流程的情况下做出决定。
谢谢
解决方案
好吧,我可能无法给你一个具体的答案,但一个简单的答案是度量 MDS 已经具有距离形式的输入矩阵(即城市之间的实际距离),因此距离在输入矩阵中具有意义和从这些距离创建实际物理位置的地图。
在非度量 MDS 中,距离只是排名的表示(即高至 7 或低至 1),它们本身没有任何意义,但需要使用欧几里得几何和然后,map 仅显示由地图上坐标之间的距离表示的排名的相似性。
推荐阅读
- docker - docker-compose - 重新启动策略 - 不保留图像中的更改
- ssl - 如何将条目插入证书吊销列表
- python - rpy2 - sqrt(e.pow)中的错误:数学函数的非数字参数
- reference - TYPO3 9.5 获得“粘贴作为参考”返回
- python - Pytorch RNN 数据来自三个不同的 csv。蟒蛇 3
- java - 替换代号中的列表
- apache-spark - 全文比较矩阵计算
- c - exec* 函数中的前两个参数是否包含冗余信息?
- vue.js - 在 Vue.js 基于模板的功能组件中,如何传递完整的上下文?
- java - Restlet 使用不同的 HTTP 方法路由相同的 API