首页 > 解决方案 > 如何处理 DBSCAN 中的字符串变量?

问题描述

今天我正在研究来自 Kaggle https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data的数据集。我想尝试使用集成了床、浴室、社区和价格的 DBSCAN。问题是我不知道如何处理字符串变量邻域,我尝试使用虚拟变量,这与很多邻域无关。有人有想法吗?非常感谢您,请随时发表评论以获取更多信息。

标签: pythonpandasmachine-learningscikit-learndbscan

解决方案


推荐阅读