r - KNN 的 Ind 函数
问题描述
这是我第一次接触 R(或任何其他语言),我正在尝试为 KNN 项目理解这些行:
#Data partition
ind <- sample(2, nrow(data), replace = T, prob (0.7, 0.3))
training <- data [ind == 1,]
test <- data [ind == 2,]
第一行告诉我,将创建一个包含替换值(1 或 2)和 70% 数据大小的样本,另一个包含 30% 的样本,对吗?
如果是这样,我的训练对象中的 ind == 1 或我的测试对象中的 ind == 2 有什么意义?
解决方案
推荐阅读
- authentication - 使用 Google API 注册
- php - 如何通过在 Laravel 中对库存单位进行分组来找到畅销书?
- excel - 选择行并将值复制到另一个范围
- algorithm - 多级报表的递归算法
- angular - Angular 应用程序的 Wordpress 插件
- google-cloud-dataflow - 数据流:N 阵列的多个扇出/组合
- r - 删除数据框中引用另一个 (R) 中不存在的 ID 的行?
- powershell - 本地管理员报告未显示域组
- php - 将月、年转换为 YYYY-MM-DD
- python - 检查列中的值是否每 7 天重复一次并进行相应过滤(熊猫)