CERN 文档服务官网
超过65万篇物理学及相关学科…
网站服务:CERN 文档服务。
Access articles, reports and multimedia content in HEP
超过65万篇物理学及相关学科…
CERN 文档服务网址入口
OpenI小编发现CERN 文档服务网站非常受用户欢迎,请访问CERN 文档服务网址入口试用。
数据统计
相关导航

Audio to Photoreal Embodiment
Audio to Photoreal Embodiment是一个生成全身照片级人形化身的框架。它根据对话动态生成面部、身体和手部的多种姿势动作。其方法的关键在于通过将向量量化的样本多样性与扩散所获得的高频细节相结合,生成更具动态和表现力的动作。通过高度逼真的人形化身可视化生成的动作,能够表达出姿势中的重要细微差别(例如嘲笑和傲慢)。为了促进这一研究方向,我们引入了一种首次亮相的多视图对话数据集,可以进行照片级重建。实验证明,我们的模型生成了合适且多样化的动作,表现优于扩散和仅向量量化的方法。此外,我们的感知评估突出了在准确评估对话姿势中的微妙动作细节方面,照片级真实感(与网格)的重要性。代码和数据集可在线获取。
暂无评论...