performance - Metal Shader 指针或本地复制性能
问题描述
我有一个金属内核函数,可以读取、处理和写入存储在设备内存中的大量数据中的元素
device Element *elements [[ buffer(0) ]],
我想知道在性能方面什么更好?:
- 将数组元素复制到本地线程内存中:
Element element = elements[thread_id];
- 或者,使用指向该元素的指针:
device Element *element = &elements[thread_id];
解决方案
推荐阅读
- java - 使用 MapStruct 将 Dto 转换为实体会出错
- css - Angular 希望根据移动设备与桌面设备通过 CSS 修改 HTML 上的 ngIf 值
- jupyter-notebook - 将python文件中的函数转换为cython并在Juypter notebook中使用
- javascript - 在@Output事件Angular 6中获取事件对象代替值
- model-view-controller - DotNetNuke MVC 路由冲突
- mysql - ExpressJS - 节点应用程序关闭后端口未释放
- python - ValueError:不允许混合 y 类型
- python - 如何在 TrackerCSRT 上使用 setInitialMask?
- c# - 解决我的人性化时间方法的问题?
- python - 从python中的.csv文件返回某种类型的所有电子邮件地址