assembly - 在汇编中编写优化的 memcopy 时要考虑的架构属性
问题描述
如果可以更好,请随意更改标题(或提供建议)。
我在 ARM Cortex M4 上,我需要在汇编中编写一个更快的内存副本。
一般来说,在汇编中编写优化的memcopy时需要考虑架构的哪些方面?
例如:我的同事正在使用具有双重问题的 ARM Cortex M7,因此他向我展示了他的汇编memcopy是如何编写的以考虑到这一点。
解决方案
推荐阅读
- python - 使用列表中的 re.sub() 替换字符后的数字
- javascript - 有没有办法在 PWA 中缓存多个文件?
- github-pages - 使用 github 操作和 github-pages-deploy-action 时出现 github 页面问题?
- python - 如何在 tensorflow 中切换到另一个优化器?
- xml - 在特定位置将子项附加到 XML
- javascript - 查询MongoDB只显示一段数据
- stored-procedures - 在我的 CosmosDb 中创建存储过程,如何通过我的 .net wep API(连接到我的 cosmosDb)访问它们
- gnuplot - 使用 gnuplot 在对数刻度中没有 mxtics
- android - MoEngage 的颤振插件?
- ios - 为什么 xcode 方案构建目标列表中的 React(missing)?