什么是虚拟数字人?
王宏飞|湖北经济学院数字媒体艺术系
元宇宙的概念引爆了互联网。元宇宙一般指平行于现实世界又能与现实世界发生联动的虚拟世界。这个虚拟世界相当于一个虚拟社会,包括了虚拟数字人、虚拟场景、虚拟经济系统和新的数字文明等,我们借助基于人工智能、虚拟现实技术的软硬件一体化设备就能穿梭其中,体验到既科幻有现实的数字生活。比如,我们可以通过技术让古代诗人李白“复活”,在元宇宙里与李白畅饮,一起吟诗作赋。这些场景都是元宇宙和虚拟数字人的发展方向也蕴藏着巨大的商机。
互联网巨头,如Meta、腾讯、百度以及英伟达,在建构其元宇宙版图时无一例外都优先布局了虚拟数字人,推出了各自的数字人创作平台。那么什么是虚拟数字人、虚拟数字人具有什么特征,与机器人又有什么区别呢?
从技术角度看,虚拟数字人是指通过计算机图形学、语音合成技术、深度学习、类脑科学、计算科学等聚合科技创设的,并具有多重人类特征,如人的外观、行为,甚至思想和价值观的虚拟形象。
从未来媒体形态和服务模式来看,聚合科技带来语义传播与无障碍传播的心空间,由此诞生的虚拟数字人将作为新媒介角色,广泛应用在元宇宙新生态中,担任着信息制造和信息传递的责任,是元宇宙中人与人、人与事物或事物与事物之间产生联系或发生孪生关系的心介质。
虚拟数字人具有三个重要特征,一是它具有人的虚拟形象,需要借助物理设备呈现,但并不是类似生活中的物理实物,这是数字人与机器人的主要区别之一;二是数字人具备独特的人设,有它自己的性格特征和行为特征;三是具备互动能力,未来虚拟数字人将能够自如地交流、行动和表达情绪。
下面,我们再来谈一谈虚拟数字人的分类。
虚拟数字人是一个统称,又称虚拟人或数字人,按不同的应用场景又可分为虚拟偶像、数字员工、虚拟主播等。虚拟数字人的商业化已经走向快车道,在现实实践中按照技术、应用、呈现方式又可以分为不同的类型。
从技术层面看,虚拟数字人可以分为真人驱动型、智能驱动型两个大类。真人驱动型强调人机耦合,是目前相对成熟的一个领域,发展到完全的智能驱动还需要一个长期的发展的过程。
真人驱动型虚拟数字人采用“CG建模+真人动作捕捉”方式构建,可以看作是传统影视制作CG技术的延续。在完成原画建模和关键点绑定后,虚拟数字人由动作捕捉设备和摄像头基于幕后的操作者的动作和表情驱动,赋予虚拟数字人动作、表情、语言,并完成表演、现场驱动、直播等。该类型主要攻克的技术难点是操控者的微表情和微动作的捕捉以及展示的稳定和流畅。
智能驱动型虚拟数字人,依托深度学习方式,可以实现实时或离线驱动眼部、眉毛、嘴部等面部表情,以及语言、动作等。智能型驱动可以让虚拟数字人通过学习数据,拥有真实人类的动作、表情甚至是记忆、思想等,形成独特的人设,获得独特的技能,并可自主完成对外互动与输出,是虚拟数字人的技术发展方向。该类型目前主要是“工具人”,例如虚拟客户、虚拟助手、虚拟导游等,主要基于知识图谱进行服务,其技术难点主要是语音合成的真实性、能否精准识别使用者、交互者的需求。而完全的智能驱动型虚拟数字人,包括人设、人的思想记忆及主动互动与输出,技术门槛高,是技术型公司攻坚的难点。
在应用层面,虚拟数字人主要分为服务型、表演型和身份型三大类,服务型虚拟数字人在企业中能被更广泛地使用;表演型虚拟数字人则因虚拟偶像、明星虚拟分身等更具流量吸引力和商业想象空间;身份型数字人最具市场想象力,因为未来元宇宙时期每个人都可以拥有自己的虚拟分身。
服务型虚拟数字人强调功能属性,如虚拟主播、虚拟教师、虚拟客服、虚拟导游等,也包括具有陪伴、关怀价值的虚拟助手、虚拟关怀师等,主要为物理世界提供各种服务,在经济生活中具有创新、降本增效的特征。
表演型虚拟虚拟数字人强调偶像属性,虚拟偶像就属于此类。当前主要被应用在娱乐、社交、办公场景中,如虚拟偶像演唱会、虚拟直播等。
身份性虚拟数字人强调身份属性,是物理世界的真人进入虚拟世界中的ID,也被成为数字分身、虚拟分身。在元宇宙世界中,身份型虚拟数字人具有广阔的使用场景,当前主要应用在娱乐、社交、办公场景中,如虚拟社区、虚拟会议等。
从呈现方式看,虚拟数字人主要分为卡通型和超写实型两大类。卡通型虚拟数字人的身份皆为虚构,他们在现实世界中并不存在,但其语言、动作、表情等都具有人的行为模式。目前,卡通型虚拟人在二次元、游戏、卡通动画中应用较多,具有制作、运营成本低以及量多的优势。
超写实虚拟虚数字人是当前主流的发展方向,通过精细设计、技术合成,尽可能贴合真人形象。从诞生之日起,超写实虚拟数字人就绕开了二维、卡通等特点,其高清人物建模、服装及专属饰品设计、专属场景设计等更具数字资产属性。因其具有“超写实”的特点,可与物理世界中的人物身份一一对应,在当前更具代表性,更可能成为未来人群与元宇宙场景链接的新工具。
2023年9月18日

