parallel-processing - 主机和设备上 cuSolver 函数的并行化设置
问题描述
我正在对 cuSolver CUDA 库中的稀疏矩阵使用 QR 和 LU 分解和求解函数。根据文档,LU 功能仅在主机路径上可用,而 QR 功能在设备上也可用。
我想知道是否有任何设置或类似的设置来控制主机和设备功能的并行化设置。两种函数的线程数如何控制?
解决方案
没有任何并行化设置。
线程数无法直接控制,并且没有公开描述该功能在您所要求的级别上如何工作。
图书馆是不透明的。与由库调用启动的任何内核调用关联的线程数将由库使用的启发式方法确定,该启发式方法未描述。
推荐阅读
- javascript - 立即调用的函数调用 setTimeout 调用循环
- vb.net - Stream.Read 上的 exe 文件
- keras - 微调自定义keras模型
- sql-server - 使用动态 SQL 将 XML 字符串展平为 SQL 表
- react-native - react-navigation:这真的是访问兄弟和父导航器的唯一方法吗?
- css - flexbox 不显示元素
- python - 未找到不同架构上的 SqlAlchemy ForeignKey
- javascript - 如何告诉 JavaScript 我的变量是数组而不是字符串?
- phone-call - 我可以启用此 Squarespace 电话号码的点击通话功能吗?
- php - 如何修复我的图片没有显示在我的页面中?