deep-learning - 带有for循环的AttentionBlock导出大图?
问题描述
有没有办法处理包括循环的注意力解码器块?实施在此Colab Link上
问题
我希望导出一个包含解码循环的注意力块。由于这个问题,LSTMCell 似乎无法导出到 ONNX 。所以我使用 LSTM 工作,如 LSTMCell,采用单时间步进行推理。我该如何处理这种模型?这是pytorch中onnx导出功能的问题吗?
如果我使用 use_external_data_format=True 选项导出,它不会保存到单个文件,而是很多单独的文件。
我在ONNX github 问题中打开了一个问题并在 stackoverflow 中询问,因为我不确定它是错误/功能问题还是问题。
笔记
似乎以下导出非常大的图形的实现无法导出到 ONNX 并显示以下错误。
RuntimeError: Exporting model exceed maximum protobuf size of 2GB. Please call torch.onnx.export with use_external_data_format=True.
解决方案
推荐阅读
- javascript - 如何从几个可能的 URL 参数之一中获取值?
- python - 是否可以在没有任何导入模块/库的情况下在 Python 中模拟按键
- google-bigquery - BigQuery 标准 SQL - 是否有任何解决方法无法在视图中保存 UDF?
- c# - 在使用 ASP.Net 和 C# 的代码中将数据 URI 设置为 asp:Image
- java - Intellij 没有抱怨 .m2 文件夹中缺少 settings.xml
- javascript - 如何使用单击事件侦听器处理异步生成器
- amazon-s3 - Amazon EMR 在为 Apache-Flink 提交作业时遇到 Hadoop 可恢复错误
- stripe-payments - 同步条纹和验证付款
- docker - Docker保存镜像差异
- javascript - 如何使用下面的链接读取 Javascript 对象