python - 可以在 Python 中并行化同一数据集上的多个 100k 套索回归吗?
问题描述
嗨,我目前在尝试对同一数据运行大量 Lasso 回归时遇到问题。我有一个包含多个 100k 行和 365 列的数据集(一年的数据)。我需要做的是根据所有其他行拟合和预测每行的一个套索回归,以便我最终得到与行一样多的单个回归。
我很难找到一种循环以外的方法来以一种相当高效的方式执行它。我尝试尝试使用 Python 的 joblib 包,它提高了性能,但如果有的话,我仍在寻找更快的方法。我也试图找到一种方法来矢量化这个问题,但我没有找到解决方案。我还浏览了 keras 以将 Lasso 回归实现为人工神经网络。
我很难想象为特定任务拟合大量简单模型是不常见的。所以我的问题是:减少此问题陈述执行时间的最佳方法是什么?据我了解,这个问题无法通过使用 GPU 来优化,因为需要安装许多单独的模型,因此无论如何 CPU 都将成为瓶颈。
顺便说一句:我可以使用 GPU,并且我有一个 16 核的 CPU。
解决方案
推荐阅读
- iframe - 有没有办法在 Salesforce 的 iframe 中添加反应应用程序?如果我也有其他方法会很有帮助
- ajax - 为什么我的 database-ajax 调用和按钮不起作用?
- angularjs - 如何在 $mdDialog 模态控制器中访问父控制器数据
- r - 保持数据框中的某些行有条件
- python-3.x - Groupby 和修改 Pandas 数据框列
- django - 有什么方法可以将当前日志记录修改为 json 格式,并添加了一些其他字段 python 日志记录
- xml - 如何填写 .ODT 表中的一列?
- twilio - 我无法使用
在我的 webhook 代码中,当 twilio 号码上有语音呼叫时完成路由 - jquery - jQuery - 如何在 iframe 正文上设置选择文本?
- android - 为什么我的闹钟比我设定的时间早触发?