HeyGem数字人
一个超轻量级、可以在移动端实时运行的数字人模型
LatentSync使用Whisper将梅尔谱图转换为音频嵌入,然后通过交叉注意力层将其集成到U-Net[…]
视觉质量光盘的权重已在自述文件中更新!以高精度将唇语视频同步到任何目标语音💯.试试我们的互动演示。✨适[…]
将焦点转移到肖像动画中的整体音频感知
这个仓库是MimicTalk的官方PyTorch实现,用于实现特定说话人的高表现力的虚拟人视频合成。该仓库代[…]
支持Docker快速部署超轻量级,配置要求低于2核2G支持Dify/FastGPT等编排框架服务接[…]
您的邮箱地址不会被公开。 必填项已用 * 标注
评论 *
显示名称 *
邮箱 *
网站
在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。
一个超轻量级、可以在移动端实时运行的数字人模型