gpgpu - GPU的内存带宽受限和计算受限应用
问题描述
在研究 GPU 和使用它们的应用程序时,经常使用术语“内存带宽受限”和“计算受限”而没有严格定义它们。(或解释它们是什么)
关于这个问题,我有 2 个问题。
如果一个应用程序是内存带宽受限的,这是否意味着应用程序会运行得更快(瓶颈是内存访问带宽)和更好的内存访问速度?如果一个应用程序是计算受限的,这是否意味着如果它有更多的计算资源或更快的计算,它会显示出更高的性能?就像减少单个操作的延迟并拥有更多的 ALU 单元一样)
如果我的理解是真的,那么今天的大多数应用程序都是内存带宽受限的,而不是计算受限的。自从流行使用 GPU 以来,情况是否一直如此?
解决方案
推荐阅读
- javascript - Spring 控制器在测试环境中被调用两次
- java - Hazelcast反序列化:反序列化后父类属性值为空
- python - C++ Qt:QProcess运行Python脚本路径指定Python版本
- yii2 - Yii2 获取正确的客户端 IP
- jenkins - Jenkins - 将变量写入日志文件
- java - Selenium ChromeDriver getPageSource() 不在无头模式下工作
- excel - 复杂的索引/匹配?还是 VLOOKUP?
- php - php - for 循环重复自身/乱序
- javascript - 有没有一种方法可以将 doc 值复制到另一个而不提取数据并发送回
- oauth-2.0 - keycloak 使用 oauth2 连接后端系统