dask - 如何正确编写与 dask 分开的时间序列?
问题描述
我正在尝试为 Dask 实施https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.TimeSeriesSplit.html。我现在得到的最简单的是如下所示:
def train_test_split_time_series(dd_feature_009a013a, dd_price_solely_y, time_series_gap = pd.Timedelta("1d")+pd.Timedelta("5m"),split_ratio = 0.8):
begin_time = dd_feature_009a013a.index.min().compute()
end_time = dd_feature_009a013a.index.max().compute()
split_train_end = pd.to_datetime((begin_time.timestamp()* (1-split_ratio) + end_time.timestamp()*split_ratio)*1e9)
split_test_start = split_train_end + time_series_gap
return dd_feature_009a013a.loc[:split_train_end],dd_feature_009a013a.loc[split_test_start:],dd_price_solely_y.loc[:split_train_end],dd_price_solely_y.loc[split_test_start:]
只是想知道有没有更好的方法来编写时间序列拆分在 dask 中?如果是这样,我该怎么写?
解决方案
推荐阅读
- javascript - bind 和 apply - bind 不像 apply 那样工作
- r - Keras/Tensorflow 安装 R
- php - 是否有 RC4 的版本或修改会生成可安全用作 cookie 值的加密字符串
- java - 生产者 - 使用信号量的消费者实现
- hive - Hive UDF 仅适用于独立的 select 语句,而不适用于“将表创建为 select...”或“insert into .. select..”
- python - 如何将 KerasClassifier、Hyperopt 和 Sklearn 交叉验证放在一起
- javascript - 错误:ENOENT,当我使用 nodejs 下载 .jpg 时没有这样的文件或目录
- regex - Lua字符串模式检查字符是否不在单词中
- laravel-5 - 如何在导入所有现有表名时排除表名
- keras - 非常好的验证准确性,但预测不好