科学家开发DIRFA：输入图片和音频，可生成说话视频-家维网「半小时极速上门」

科学家开发DIRFA：输入图片和音频，可生成说话视频

IT之家 11 月 17 日消息，来自新加坡南洋理工大学（NTU Singapore）的科研团队近日开发出了 DIRFA 工具，用户给一张图片以及音频内容，可以自动生成 3D 视频，并实现口型和声音的同步协调。

DIRFA 的全称为 DIverse yet Realistic Facial Animations，训练了超过 6000 多人的 100 万个视频片段，音频片段来自一个名为 VoxCeleb2 数据集的开源数据库，并关联面部表情和头部运动。

研究人员表示，DIRFA 可能会在包括医疗保健在内的各个行业和领域带来新的应用，因为它可以实现更复杂和逼真的虚拟助手和聊天机器人，从而改善用户体验。

DIRFA 还可以作为言语或面部残疾人士的强大工具，帮助他们通过富有表现力的头像或数字表示来传达他们的想法和情感，从而增强他们的沟通能力。

IT之家附上论文参考地址：Rongliang Wu, Yingchen Yu, Fangneng Zhan, Jiahui Zhang, Xiaoqin Zhang, Shijian Lu. Audio-driven talking face generation with perse yet realistic facial animations. Pattern Recognition, 2023; 144: 109865 DOI: 10.1016/j.patcog.2023.109865

标题：科学家开发DIRFA：输入图片和音频，可生成说话视频

地址：http://www.cdaudi4s.com/gzdm/44837.html

科学家开发DIRFA：输入图片和音频，可生成说话视频

南宁青秀约克YORK空调服务热线(空调移机怎么操作图文)

三星电视故障代码是什么问题(如何诊断和解决)？

什么牌子壁挂炉省气(壁挂炉省气品牌推荐：节能高效，安全可靠的选择)

油价下跌！今天3月22日全国油价，预计国内油价或将大幅下调550元

郑州约克YORK空调官方电话(约克精密空调品牌排名及价格)

怎样查空调的代码(简单易懂的方法分享)

英媒：数十名雇员在为女王后事忙碌时，查尔斯国王却要裁掉他们

杜兰特拿捏气质！一天15消息：詹姆斯克莱训练，字母哥太霸气了

长虹空调故障代码大全(长虹空调故障代码一览，全面解析解决方案)

三星折叠新机Galaxy Z Fold 5细节曝光：将采用水滴状铰链

聚焦阿尔茨海默病防治四份科普报告正式发布

三菱电子中央空调厂家24小时人工电话(三菱空调怎么拿下来拆卸三菱空调即可

美菱集成灶24小时服务热线电话(美菱集成灶24小时服务热线电话，全天候守护

YORK中央空调全国统一服务热线(约克空调百叶格栅安装公司如何选择靠谱的服务

TOSHIBA空调移机售后服务号码(如何获取TOSHIBA空调移机售后服务的联系号码？)