首页 > 解决方案 > 带有for循环的AttentionBlock导出大图?

问题描述

有没有办法处理包括循环的注意力解码器块?实施在此Colab Link上

问题

我希望导出一个包含解码循环的注意力块。由于这个问题,LSTMCell 似乎无法导出到 ONNX 。所以我使用 LSTM 工作,如 LSTMCell,采用单时间步进行推理。我该如何处理这种模型?这是pytorch中onnx导出功能的问题吗?

如果我使用 use_external_data_format=True 选项导出,它不会保存到单个文件,而是很多单独的文件。

我在ONNX github 问题中打开了一个问题并在 stackoverflow 中询问,因为我不确定它是错误/功能问题还是问题。

笔记

似乎以下导出非常大的图形的实现无法导出到 ONNX 并显示以下错误。

RuntimeError: Exporting model exceed maximum protobuf size of 2GB. Please call torch.onnx.export with use_external_data_format=True.

标签: deep-learningpytorchonnxonnxruntime

解决方案


推荐阅读