python - tensorflow 2.5.0 arm64 mac的性能
问题描述
我已经成功地从 arm64 的源代码构建了 tensorflow 2.5.0(这真的很难)
我得到了 tensorflow-2.6.0-cp38-cp38-macosx_11_0_arm64.whl 我不知道为什么它命名为 2.6.0 。然后在我的 Conda env 上通过 pip 安装包。现在我失去了表现。
使用 Apple 的 GitHub 版本的 Tensorflow 2.4.1 alpha 在同一任务中,它就像是大约 30 毫秒/步的训练(但准确度是可怕的 LSTM)现在我得到了 43 毫秒/步(准确度就像在 Google Colab 上一样)。
为什么会这样?可能是本机加速关闭,或者我--config=macos_arm64 --config=noaws --config=nogcp --config=nohdfs --config=nonccl
在 Google Colab 上使用新的 2.5.0 构建 Bec 时错过了一些东西,与 2.4.1 相比,每步低 5-6 毫秒(更好)
解决方案
推荐阅读
- google-apps-script - 使用 Google 脚本在另一张完整表格的公式中搜索和替换
- javascript - 有没有一种方法可以在 sprite.svg 文件组件上应用 javascript?
- jenkins - 詹金斯并行调用从文件加载的外部函数
- spring-boot - 即使在 MqttConnectOptions 中将自动重新连接设置为 true,Eclipse Paho MqttClient 也无法重新连接
- influxdb - 从 influxdb 2.0 中删除数据
- sql - 同一张表的SQL递归查询
- docker - 如何重用 docker-compose 并启动并运行多个实例?
- python - 标称值的标签编码
- php - PHP 在 foreach 循环中简化 array_push
- c++ - 哪个代码在内存/时间复杂度上更有效