首页 > 解决方案 > 如何在深度学习模型中将文本映射到唱歌语言(3D 头像的视觉动作)?

问题描述

虽然模型的输入是英文字母、单词或句子,但是这个模型的输出应该是什么,然后将作为 3D Avatar 的输入来执行唱歌的语言动作?是否可以使用 DL 从单词中获取姿势序列?或者如何使用人工智能而不是手动工作来实现放置在下面链接上的结果?

https://www.mocaplab.com/projects/sign-3d/

标签: python

解决方案


推荐阅读