python - sklearn 火车测试按年份划分
问题描述
我有一个从 2016 年到 2020 年的数据集,其中有一个“年份”列。我想使用 2016-2017 作为训练数据,使用 2018-2020 作为测试数据。有没有简单的方法来执行这个数据拆分?
解决方案
您可以使用 groupby 函数将 2016-2017 年的所有数据分组为训练数据,将 2018-2020 年的数据分组为测试数据。或者,您也可以使用以下代码
df_train = df[df['year'].isin(2016,2017)] and df_test = df[df['year'].isin(2018,2019,2020)]
推荐阅读
- angular - 文件上传问题
- php - 无法运行 composer update 缺少 mbstring
- hbase - HBase WAL 复制 - 是否支持从具有 HBase 1.1.2 的集群到具有 HBase 2.0.2 的集群的 WAL 复制?
- php - Laravel - 如何使用表单将变量从视图传递到控制器
- lua - 我用seek("cur",-1)从头到尾遍历一个txt文件,但是当它面对一个新行时,会有两个“\n”在连续的位置,为什么?
- php - 显示从 ajax 和 codeigniter 循环的选择复选框
- android - 如何覆盖android中的虚拟按钮和手势(主页和最近的应用程序按钮)?
- javascript - Barba js滚动位置
- node.js - 将结构数组从 C 程序返回到 NodeJS/Javascript
- flutter - Flutter Textform Validation 未显示