machine-learning - 如何使用具有许多时间序列数据的集合,每个数据的平均长度为 20?
问题描述
我有大量的短时间序列数据(短时间序列的平均长度 = 20)。数据的总大小约为 6 GB。当前系统工作方式如下: 1) 将 6 GB 数据加载到 RAM 中。2) 处理数据。3)将每个时间序列对应的预测值放入excel中。
问题是每次我运行上述系统时,我的 8 GB RAM PC 都需要将近 1 个小时。请提出一个更好的方法来减少我的时间。
解决方案
使用更快的编程语言。例如,您可以更喜欢使用 Julia 或 C++ 而不是 MATLAB 或 Python。
试着让你的代码更有效率。例如,不要通过复制数据(按值传递)将数据传递给您的函数,而是尝试将它们作为引用传递(按引用传递与按值传递有什么区别?)。使用更高效的数据结构。
将您的数据集分成更小的部分。分别处理每个小部分。然后,在最后合并输出。
推荐阅读
- html - HTML书签返回首页
- r - 尝试更改 ggplot 中的气泡颜色时出现问题
- python-3.x - Python 多进程调度
- python - 最后 N 个数据点的 Pyspark 结构化流窗口(移动平均)
- c# - UTF-8 返回错误的字符
- node.js - 如何从 mongoDB 获取多个文档?
- php - Facebook API publish_pages 权限
- php - 在抽象基类中使用@dataProvider 并在实际测试中实现
- keras - DDPG(Tensroflow 2)演员更新
- react-native - 如何检测反应原生 iOS 的启用位置权限,如果未选中则请求授予权限?