首页 > 解决方案 > Metal Shader 指针或本地复制性能

问题描述

我有一个金属内核函数,可以读取、处理和写入存储在设备内存中的大量数据中的元素

device Element *elements [[ buffer(0) ]],

我想知道在性能方面什么更好?

Element element = elements[thread_id];

device Element *element = &elements[thread_id];

标签: performancememorykernelgpumetal

解决方案


推荐阅读