首页 > 解决方案 > LaPack 等库中最先进的异地矩阵转置?

问题描述

我正在寻找在 C/C++ 中计算大型矩阵 (>> 1024x1024) 的异地转置的最有效方法。我已经在 SO 中遇到了几个答案,但是我的工作需要更多“值得信赖的”资源(如 blas/lapack)。

通过在线快速搜索,我了解到 blas 没有这样的功能。但暗示 Lapack 实现了矩阵转置。我一直在寻找一段时间(包括 lapack 文档),但没有找到答案。

我知道 MKL-Blas 实现了矩阵转置,但我在远程服务器上工作,我无法在那里安装它。

标签: matrixtransposelapack

解决方案


OpenBLAS(一个 BLAS 实现)支持那些:


推荐阅读