tensorrt - 带有 CTC 层的 TensorRT
问题描述
我想使用 tensorRT 优化我的模型,但是,我的模型中的 CTC 层不受 tensorRT 支持。有人用 tensorRT 成功地优化了 CTC 层。
解决方案
我已经设法分两个步骤来做到这一点,首先使用 TensorRT 来获取概率 logits,然后使用 C++ CTC 解码器来解码 logits。
由于 CTC 的解码适用于 CPU,而且我设法使用 GPU 来获取批次的 logit,并在 GPU 运行时将每批次的 logit 排入 CPU CTC 解码队列。所以这样一来,CPU和GPU就可以并行运行了。CTC 解码器的 C++ 实现可以在 Github 或 Tensorflow 存储库中找到。
推荐阅读
- sum - 具有重复记录 SUM 的查找集不起作用 SSRS 2008
- java - TestNG - 为类级别测试提供参数
- python-3.x - 使用 seaborn 绘制多个直方图
- asp.net-mvc - MVC - 发布时清除会话
- php - 在 php 中的选择选项上刷新页面
- python - Python使用super覆盖属性,传递参数时出现意外参数错误
- android - Android Studio 3.2“找不到目标设备”
- string - 具有字符串类型的 CAPL 关联数组
- javascript - 如何在不重新加载图表的情况下更新选项(ng2-chart)
- c# - 带有模式 MainWindow 的 WPF 应用程序