这个仓库是MimicTalk的官方PyTorch实现, 用于实现特定说话人的高表现力的虚拟人视频合成。该仓库代码基于我们先前的工作Real3D-Portrait (ICLR 2024),即基于NeRF的one-shot说话人合成,这让Mimictalk的训练加速且效果增强。您可以访问我们的项目页面以观看Demo视频, 阅读我们的论文以了解技术细节。
-技术亮点:-音频驱动半身动画:支持头部、手势与语音情感同步,开源免费;-开源生态:GitHub社区[…]
FLOAT真的太好用了,唇形同步质量高,生成速度还很快,6秒音频我只要6秒就生成好了FLOA[…]
将焦点转移到肖像动画中的整体音频感知
LatentSync使用Whisper将梅尔谱图转换为音频嵌入,然后通过交叉注意力层将其集成到U-Net[…]
支持Docker快速部署超轻量级,配置要求低于2核2G支持Dify/FastGPT等编排框架服务接[…]
视觉质量光盘的权重已在自述文件中更新!以高精度将唇语视频同步到任何目标语音💯.试试我们的互动演示。✨适[…]
您的邮箱地址不会被公开。 必填项已用 * 标注
评论 *
显示名称 *
邮箱 *
网站
在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。
-技术亮点:-音频驱动半身动画:支持头部、手势与语音情感同步,开源免费;-开源生态:GitHub社区[…]