首页 > 解决方案 > 我应该将目标类转换为浮点数还是整数?

问题描述

sklearn中,我应该将target classas 转换为integer or float吗?它会有所作为吗?

我问是因为我正在训练 a并在这个Neural Network问题中读到,将一个类转换为浮点数可能会导致问题。

然后根据this question我认为答案是Integer,但我想知道是否是这种情况以及为什么。

标签: pythonscikit-learn

解决方案


在 Scikit-learn 中,将目标类强制转换为 float 或 int 类型(甚至是字符串,请参阅:Is numeric encoding required for the target variable in classification?)是无所谓的,它们都是允许的。您只需要注意分类目标将保持与输入相同的类型,因此如果您的输入是浮点类型,您将获得预测的浮点向量(参见:https ://scikit-learn.org/stable /tutorial/basic/tutorial.html#type-casting)。

在此示例中,您将直接验证如何KNeighborsClassifier生成相同的类预测(但具有不同的数据类型,具体取决于目标类输入类型):

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

data = load_iris()
(X_train, X_test, 
 y_train, y_test) = train_test_split(data.data,
                                     data.target,
                                     test_size=0.33,
                                     random_state=42)
neigh = KNeighborsClassifier(n_neighbors=3)

neigh.fit(X_train, y_train.astype(int))
int_preds = neigh.predict(X_test)

neigh.fit(X_train, y_train.astype(float))
float_preds = neigh.predict(X_test)

print(int_preds.dtype, float_preds.dtype)
print("Same classes:", (int_preds == float_preds).all())

推荐阅读