首页 > 解决方案 > kmeans(dataset, k) 中的错误:集群中心多于不同的数据点,未使用的参数(标头 = FALSE),R

问题描述

我正在尝试应用 psf 模型来预测值序列中的下一个值(请参见下面的数据框)。我不断收到同样的错误:

data_rel_1 <- structure(list(job1category = c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 
1, 1, 1, 1, 1), job2category = c(2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 
1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 
1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 
1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 
1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 
1, 1, 1, 1, 1), job3category = c(2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 
1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 
1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 
1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 
1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 
1, 1, 1, 1, 1), job4category = c(1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 
2, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 1, 
2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 
2, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 1, 
2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 
2, 1, 0, 2, 2)), class = c("spec_tbl_df", "tbl_df", "tbl", "data.frame"
), row.names = c(NA, -99L), spec = structure(list(cols = list(
    job1category = structure(list(), class = c("collector_double", 
    "collector")), job2category = structure(list(), class = c("collector_double", 
    "collector")), job3category = structure(list(), class = c("collector_double", 
    "collector")), job4category = structure(list(), class = c("collector_double", 
    "collector"))), default = structure(list(), class = c("collector_guess", 
"collector")), skip = 1L), class = "col_spec"))
model1 <- psf(data_rel_1)
Error in kmeans(dataset, k) : more cluster centers than distinct data points.

我尝试在 read_csv 中添加 header = FALSE 但这给了我以下错误:

unused argument (header = FALSE)

有没有人有这方面的经验或知道我该如何解决这个问题?谢谢!!!

标签: rcluster-computing

解决方案


推荐阅读