r - 如何使用因子转换大列
问题描述
我为我的具有酒店列的数据集编写了一个机器学习代码。酒店列包含 300 个酒店名称。对于数据预处理,我看到我们必须使用因子。有没有简单的方法来隐藏它,因为级别的值太多了?
解决方案
很简单,使用as.factor()
函数将列形式转换character
为factor
.
这是一个示例
# Sample data
data
a b
1 A 1
2 B 2
3 C 3
4 A 4
5 B 5
class(data$a)
[1] "character"
# Converting to factor
data$a <- as.factor(data$a)
# Results
class(data$a)
[1] "factor"
summary(data$a)
A B C
2 2 1
推荐阅读
- android - 进度条可见性属性不适用于数据绑定
- javascript - SAPUI5的表控件中未加载“子模型”数据
- c# - 不同的 Shell 上下文菜单与 Windows 资源管理器上下文菜单
- python - 虚拟环境中的 Python site.getsitepackages() 显示两条路径,我可以删除非虚拟环境之一吗?
- pdftron - 如何在 Pdftron 的画布上访问文本层
- reactjs - 电子中的 Antd Datepicker - 无法读取 null 的属性“年份”
- redis - Redis命令行如何订阅“+odown”、“+sdown”、“+switch-master”?
- git-bash - Gradlew 使用 Git Bash 打印控制字符
- amazon-web-services - AWS Application Load Balancer 是否处理反向代理?
- javascript - 如何增加 DOM(oneliner)?