r - R C5.0决策树-“c50代码调用退出值为1”错误
问题描述
我有一个 .csv 数据集,我正在尝试在其上运行 C5.0 决策树。该数据集是一个经过修改以排除任何特殊字符的假新闻数据集。这是我的源代码:
data <- read.csv("C:/Users/Admin/downloads/fnn_test.csv", stringsAsFactors = TRUE)
data <-na.omit(data)
data <- data[-1]
data <- data[-1]
str(data)
#assigning the diagnosis as factors
data$LBL <- factor(data$LBL, levels = c('fake', 'real'),
labels = c("Fake", "Real"))
#dividing dataset
data_train <- data[1:50, 1:5]
data_test <- data[51:70, 1:5]
str(data_train)
#defining seed and library
set.seed(123)
library(C50)
#
predModel <- C5.0(LBL ~ ., data_train)
summary(predModel)
我在运行决策树时得到的错误是“c50 code called exit with value 1”,在摘要中它说“第 17 行‘undefined.names’:超长名称:检查数据文件格式”。我替换了数据集中的所有特殊字符,因为它给了我不同的错误,这就是我剩下的。
这是数据集的下载:https ://drive.google.com/file/d/112X0cnV7lwkUh8JawPD50_iJ58FJa-OH/view?usp=sharing
解决方案
推荐阅读
- python - Pygame 读取 MIDI 输入
- python - 如何用随机元素替换元素?
- angular - 新行不显示在 mat-table 的表单数组中
- angular - Angular 9 typescript 如何使一个带有for循环的函数先完成,然后再继续下一个函数?
- c# - 我如何检查值是否在 sql server 中指定的日期之前存在
- typescript - 包含类型化对象和/或已知类型的成对元素的数组的类型
- google-sheets - 每行一次 COUNTIF,ARRAYFORMULA 中的花括号中有多个条件(Google 表格)
- inno-setup - Inno Setup 关闭已经打开的应用程序,无需用户交互
- css - 删除主题覆盖中 Material UI 组件的 CSS 规则
- data-structures - 如果恶意黑客试图在 Hash 键上强制冲突,你如何避免 Hash 中的冲突?