python - Python,Numpy - 标准化矩阵/数组
问题描述
这很可能是一个愚蠢的问题,但作为 Python/Numpy 的初学者,无论如何我都会问它。我遇到了很多关于如何在 numpy中规范化数组/矩阵的帖子。但我不确定为什么。为什么/何时需要在 numpy 中对数组/矩阵进行归一化?什么时候使用?
规范化在不同的上下文中可以有多种含义。我的问题属于数据分析/数据科学领域。在这种情况下,标准化意味着什么?或者更具体地说,在什么情况下我应该标准化一个数组?
这个问题的第二部分是 - 标准化的不同方法是什么,它们可以在所有情况下互换使用吗?
第三部分也是最后一部分——规范化可以用于任何维度的数组吗?
任何参考资料(对于初学者)的链接将不胜感激。
解决方案
考虑尝试对具有两个数值属性 A 和 B 的对象进行聚类。两者同样重要。属性 A 的范围可以从 0 到 1000,属性 B 的范围可以从 0 到 5。
如果您没有对 A 和 B 进行规范化,那么在应用任何标准距离度量时,属性 A 会完全压倒属性 B。
推荐阅读
- ignition - 在 Ignition 中查找原始标签的 Max 和 Stdev
- python - 在“n”下面找到 3 或 5 的倍数
- spring - 'CommonDatabaseConfig' Spring Boot Batch XML 方法中的用户定义 bean 方法 'entityManagerFactory'
- c# - 尽管等效,但在将路由字典中的元素传递给控制器时类型不匹配
- c++ - 比较运算符上所需的 l 值错误
- llvm - llvm:指针操作的值
- amazon-ec2 - EC2 用户数据代码提交克隆失败
- julia - 如何在 Julia 1.0 中安装软件包(UndefVarError: Pkg not defined)
- angular - 如何使用 Angular 将 Canvas 绘图保存到 Firebase?
- python - 如何拆分此十六进制字节字符串