杭州凌腾科技有限公司-远程医疗一体化会诊车_查房车_护理车_结算车_视频会诊_远程会诊_远程医疗_移动查房车_移动工作站_临床智能工作站（推车）_移动医疗手推车_移动医疗工作站_数字医护工作站_医用查房车

新闻动态

微软推出 VASA-1 AI 框架，可即时生成 512x512 40FPS 逼真对口型人像视频

发布日期：2024-04-22

微软今天公布了一项图生视频的VASA-1框架，该AI框架只需使用一张真人肖像照片和一段个人语音音频，就能够生成精确逼真的对口型视频（生成念稿子的视频），据称在表情和头部动作方面特别自然。目前业界相关许多研究都集中在对口型上，而面部动态行为及头部运动情况通常被忽视，因此生成的面部也会显得僵硬、缺乏说服力且存在恐怖谷现象。而微软的VASA-1框架克服了以往面部生成技术的限制，研究人员利用了扩散Transformer模型，在整体面部动态和头部运动方面进行训练，该模型将所有可能的面部动态，包括嘴唇动作、表情、眼睛注视和眨眼等行为均视为单一潜在变量（即一次生成整个具有高度细节的人脸），号称能够即时生成512×512分辨率40FPS的视频。

返回目录

微软推出 VASA-1 AI 框架，可即时生成 512x512 40FPS 逼真对口型人像视频

凌腾科技智能推车，多种合作方式诚招经销商！ 0571-87177388