首页 > 解决方案 > R C5.0决策树-“c50代码调用退出值为1”错误

问题描述

我有一个 .csv 数据集,我正在尝试在其上运行 C5.0 决策树。该数据集是一个经过修改以排除任何特殊字符的假新闻数据集。这是我的源代码:

data <- read.csv("C:/Users/Admin/downloads/fnn_test.csv", stringsAsFactors = TRUE)
data <-na.omit(data)
data <- data[-1]
data <- data[-1]
str(data)

#assigning the diagnosis as factors
data$LBL <- factor(data$LBL, levels = c('fake', 'real'),
                               labels = c("Fake", "Real"))

#dividing dataset
data_train <- data[1:50, 1:5]
data_test <- data[51:70, 1:5]

str(data_train)

#defining seed and library
set.seed(123)
library(C50)

#
predModel <- C5.0(LBL ~ ., data_train)
summary(predModel)

我在运行决策树时得到的错误是“c50 code called exit with value 1”,在摘要中它说“第 17 行‘undefined.names’:超长名称:检查数据文件格式”。我替换了数据集中的所有特殊字符,因为它给了我不同的错误,这就是我剩下的。

这是数据集的下载:https ://drive.google.com/file/d/112X0cnV7lwkUh8JawPD50_iJ58FJa-OH/view?usp=sharing

这就是数据集的样子

标签: r

解决方案


推荐阅读