python - 聚类前的标准化
问题描述
如果我们有使用假人和标签编码将分类数据转换为数值的分类数据,是否必须在聚类之前对数据进行规范化?如果是,那么在这种情况下使用哪种归一化技术最合适?
解决方案
无需对分类值的数据进行标准化。对特征进行规范化/标准化以使所有特征达到相似的规模。
如果您使用 k 最近的邻居,它只会查看样本之间的相似性,因此在这种情况下,更大/更小的关系不会影响它。
最后,标准化/标准化不会影响值的顺序。因此,如果 x1 大于 x2,则在归一化或标准化之后,它们都可能具有不同的值,但它们之间的关系不会改变。
推荐阅读
- amazon-web-services - 在coginto用户池中为用户组添加服装角色
- java - 用户第二次打开片段或活动时如何停止重新加载数据?
- c# - Azure 函数文件上传和读取内容
- reactjs - 开玩笑测试句柄DropdownChange
- java - React + OIDC 的 Spring Security 代理
- java - Spring Boot - 在运行时或编译时有条件地加载模块
- java - JNI 中的内存泄漏
- php - 谷歌日历会议链接不是通过谷歌日历 API (PHP) 自动创建的
- php - 即使在我关闭进程后,php artisan serve 仍然可以工作
- angularjs - 如何使用 SignalR 与 angularJS 和 Oracle 使用 DbChangeNotification