三星使用AI将照片转换为会说话的头像
来自位于莫斯科的三星AI中心的研究人员创建了一个新系统,可以将静止的面部图像转换为人脸的视频序列,从而制作语音表达。根据该研究,该系统通过将目标面部的面部地标应用到源面(例如,静止照片)上来创建逼真的虚拟对话头,以允许目标面控制源面的移动方式。“这种能力具有远程呈现的实际应用,包括视频会议和多人游戏,以及特效行业,”三星表示。虽然“deepfake”技术的存在并不是什么新鲜事,但三星的新系统并不使用3D建模,只需要一张照片来创建一个面部模型。三星表示,如果系统能够使用32个图像来创建模型,系统将能够“实现完美的真实感和个性化评分”。
据三星公司称,能够用有限数量的镜头创建“深度假”视频的能力是由于该系统具有大型数据库,这些数据库对应于具有不同外观的不同扬声器。通过依靠这个数据库,结合源面的面部标志,系统能够创建各种逼真的面部模型。之后,系统使用生成对抗网络,将各种人脸模型相互比较,以确定哪个模型最“真实”。通过过滤创建的各种模型,系统然后能够选择用于视频序列的最终模型。所谓的“深度虚假”视频目前是美国立法者的一个主要关注点,他们担心人工智能操纵人们说他们从未做过的事情的视频可能成为国家安全威胁。9月,Facebook首席运营官谢丽尔桑德伯格宣布,它已经创建了一个机器学习模型,用于检测潜在的虚假照片或视频,以从其平台中删除深度虚假内容。