r - KNN 用于从新数据中预测类别
问题描述
如何为没有类的新数据提供类?
我使用 KNN 算法,这里是建模代码。(文本分类)
train_set <- sample(1:nrow(dtm.df), 15)
test_set <- (1:nrow(dtm.df))[- train_set]
# Isolate classifier
classifier <- dtm.df[, "class"]
# Create model data and remove "category"
model_data <- dtm.df[,!colnames(dtm.df) %in% "class"]
# Create model: training set, test set, training set classifier
knn.pred <- knn(model_data[train_set, ], model_data[test_set, ],
classifier[train_set], k=5)
我试试这段代码
newdata <- data.frame(text="bagus sekali")
newdata <- Corpus(VectorSource(newdata))
newdata <- DocumentTermMatrix(newdata)
model = knn(model_data[train_set, ], newdata, classifier[train_set], k =5)
knn 中的错误(model_data[train_set, ], newdata, classifier[train_set], : 'test' 和 'train' 的尺寸不同
我知道暗淡是不同的,测试是 37 288,新数据是 1 1。
解决方案
推荐阅读
- c# - 这种使用Unicode大写字符串的方法是否安全?
- azure-active-directory - 如何授予企业应用的租户范围的应用权限?
- javascript - 没有从我的第三方 API 调用快速路由 node.js 获取响应对象
- image - 颤振:边框半径不适用于图标
- android - Appflow Deploy 插件导致错误:Ionic Capacitor 项目中的“未捕获(承诺)字符串资源 id #0x0”
- xcode - 无法加载文件或程序集“Microsoft.Windows.Simulator.Client,”Microsoft.VisualStudio.CppSvc.Internal StreamJsonRpc.RemoteInvocationException
- jquery - 正则表达式匹配至少一个大写字母并跟随可选的 +/- 并且没有特殊字符
- php - wordpress wp所有导入问题
- c# - C# 检查值的最佳方法是否存在于列表中多次
- tensorflow - 微调时 Keras 模型变得更糟