TANGO:基于分层音频运动嵌入和扩散插值的语音共演手势视频重现
-技术亮点:-音频驱动半身动画:支持头部、手势与语音情感同步,开源免费;-开源生态:GitHub社区[…]
支持Docker快速部署超轻量级,配置要求低于2核2G支持Dify/FastGPT等编排框架服务接[…]
LatentSync使用Whisper将梅尔谱图转换为音频嵌入,然后通过交叉注意力层将其集成到U-Net[…]
将焦点转移到肖像动画中的整体音频感知
视觉质量光盘的权重已在自述文件中更新!以高精度将唇语视频同步到任何目标语音💯.试试我们的互动演示。✨适[…]
一个超轻量级、可以在移动端实时运行的数字人模型
您的邮箱地址不会被公开。 必填项已用 * 标注
评论 *
显示名称 *
邮箱 *
网站
在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。
-技术亮点:-音频驱动半身动画:支持头部、手势与语音情感同步,开源免费;-开源生态:GitHub社区[…]