首页 > 解决方案 > KNN 用于从新数据中预测类别

问题描述

如何为没有类的新数据提供类?

我使用 KNN 算法,这里是建模代码。(文本分类)

train_set <- sample(1:nrow(dtm.df), 15)
test_set <- (1:nrow(dtm.df))[- train_set]

# Isolate classifier
classifier <- dtm.df[, "class"]

# Create model data and remove "category"
model_data <- dtm.df[,!colnames(dtm.df) %in% "class"]

# Create model: training set, test set, training set classifier
knn.pred <- knn(model_data[train_set, ], model_data[test_set, ],
classifier[train_set], k=5)

我试试这段代码

newdata <- data.frame(text="bagus sekali")
newdata <- Corpus(VectorSource(newdata))
newdata <- DocumentTermMatrix(newdata)
model = knn(model_data[train_set, ], newdata, classifier[train_set], k =5)

knn 中的错误(model_data[train_set, ], newdata, classifier[train_set], : 'test' 和 'train' 的尺寸不同

我知道暗淡是不同的,测试是 37 288,新数据是 1 1。

标签: rknntext-classificationtf-idf

解决方案


推荐阅读