首页 > 解决方案 > Python,Numpy - 标准化矩阵/数组

问题描述

这很可能是一个愚蠢的问题,但作为 Python/Numpy 的初学者,无论如何我都会问它。我遇到了很多关于如何在 numpy中规范化数组/矩阵的帖子。但我不确定为什么。为什么/何时需要在 numpy 中对数组/矩阵进行归一化?什么时候使用?

规范化在不同的上下文中可以有多种含义。我的问题属于数据分析/数据科学领域。在这种情况下,标准化意味着什么?或者更具体地说,在什么情况下我应该标准化一个数组?

这个问题的第二部分是 - 标准化的不同方法是什么,它们可以在所有情况下互换使用吗?

第三部分也是最后一部分——规范化可以用于任何维度的数组吗?

任何参考资料(对于初学者)的链接将不胜感激。

标签: pythonarraysnumpynormalization

解决方案


考虑尝试对具有两个数值属性 A 和 B 的对象进行聚类。两者同样重要。属性 A 的范围可以从 0 到 1000,属性 B 的范围可以从 0 到 5。

如果您没有对 A 和 B 进行规范化,那么在应用任何标准距离度量时,属性 A 会完全压倒属性 B。


推荐阅读