作者/刘晓洁

2022世界人工智能大会(WAIC 2022) 在9月1日正式开幕,此次大会中元宇宙是一大展出亮点,作为最快落地场景的虚拟数字人也频繁在大会出镜互动。

“我们不应该把元宇宙看成一个空间概念,而应该看成一个时间概念,即当人们在虚拟世界里花的时间越来越多,直到超过现实世界时,才可以说我们进入了元宇宙时代。”在9月1日晚的“滴水湖AI夜话——AI+元宇宙”论坛上,unity中国总裁兼首席执行官张俊波从生产效率和实时交互上为我们提供了一个技术人的观察视角,及其对未来的判断和思考。


(资料图片仅供参考)

元宇宙仍然遥远

“我在互联网及软件行业有20多年的从业经验,这些年科技进步可以说是飞速的,非常令人惊讶,但是一看生产流程,又觉得我们才刚刚起步,还处于工业革命之前,技术刚刚萌发却没有实现大批量规模化生产的阶段,生产效率比较低下。”

以近几年非常火爆的虚拟数字人为例,张俊波认为,虽然很多制作数字人的公司用的是元宇宙的概念,但是其本质上却是图形渲染公司,“比如一个虚拟偶像类的数字人,其背后是动画师们在一帧一帧的精修渲染,或者是依赖于对中之人的动作捕捉,不仅成本非常高,且制作流程十分耗时。”

现在市场上也有可以批量生产的数字人,但张俊波表示这些虚拟形象同质化严重,不能充分表达用户的个性化需求。这不仅是国内的现状,整个国际市场都是如此。基于当前技术和成本的限制,拥有雄厚资本与能力的企业尚且不能做到规模化生产,更不用谈让广大消费者来参与。

元宇宙离我们还有距离,因为张俊波认为元宇宙是一个3D版本的互联网,其特征为始终实时3D,高度交互、高度社交和持续稳定。

从这个定义来看,现在很多元宇宙概念产品不能被称之为真正意义上的元宇宙。如提前录制的虚拟演唱会、云游戏等,要么静态展示无法互动,即使互动也是由设定好的程序按部就班去执行,无法对设定程序以外的行为做出反应,无法满足实时性与交互性特点。

这需要元宇宙世界有足够丰富有趣的内容,给人以比现实世界更多元的体验,才能让人们更愿意在虚拟世界中花时间。但要实现这一点需要海量的内容,海量的虚拟人、场景、资产等素材。

AI加速元宇宙的到来

目前相对传统的生产方式无法满足元宇宙时代海量的内容需求,基于此,张俊波认为,能够指数级降低数字资产制作成本的AI技术,是实现元宇宙必不可少的先决条件。

“赋予工具智慧,将工具训练成技术人员大脑的延伸,用AI打造数字资产制作的流水线,才能够大规模生产高质量的虚拟内容,带动整个行业加速发展。”

元宇宙有三个不可或缺的基本要素,人、场、物,这些数字资产共同构建了元宇宙世界,影响着人们在元宇宙世界中的体验,unity在这三个领域的探索指引了一些AI技术可以应用的方向。

当下元宇宙最热门的方向是虚拟数字人,张俊波表示,在这个领域当前很多公司采用的流程是,让模特在光场设备中做出极限表情并拍摄下来,而后让艺术家进行模型清理,这个步骤耗时耗力。

人的表情是由面部肌肉牵动的,只要掌握了面部肌肉间的相互的作用和关系,就可以借助AI技术模拟出人类的所有表情,而不需要找真人一一来扫描。张俊波展示了一段由加拿大虚拟角色软件开发商Ziva Dynamics制作的数字人的视频,其神态和形象已经可以媲美真人。

在今年初,Ziva Dynamics被unity收购,张俊波介绍,Ziva Dynamics精通复杂模拟与模型变形、机器学习与实时角色创作,同时团队对复杂的解剖学模拟与实时艺术工具有着深厚的专业知识和理解。

基于Ziva Dynamics的技术,原本要耗费数周甚至数月的角色脸部创作时间,浓缩成云端的一次点击。艺术家的创作周期从十几天缩短到短短的两个小时。AI技术简化数字人制作流程,从而可以让规模化的数字人生产变成可能。

除了虚拟数字人之外,场景也是元宇宙的重要部分,在这方面,AIGC将发挥重要作用。

未来的元宇宙会是一个开放大世界,现在创作数千甚至数万平方公里的虚拟世界,已无法用纯人工的方式来摆放和设计每一寸土地,程序化和规则化的生存世界,成为开放大世界的一个关键技术。

在元宇宙的物体方面,逐一建模复刻效率同样低下,通过可视化的方式与3D扫描,可以把现实世界中的对象进行3D重建。用户只需用手机拍摄一分钟的视频,然后将其上传至云端,视频就会在AI技术的辅助下进行处理与压缩,从而成为高质量的3D模型。在未来这项技术可以成为用户在元宇宙中的好帮手,比如把生活中的摆件、书籍等物品扫描成3D模型。

在解决了人、物、景的问题后,交互性、社交属性同样是不可忽视的基本特征,因为元宇宙并不仅仅是一个静态的画面。这要求元宇宙世界里的数字人能够与用户对话,给出实时的反应和反馈,不仅仅要有精美灵动的外表,还需要有近乎于人的智能甚至灵魂。

华院计算虚拟数字人产品总监冯绚博士持有同样观点,此前在接受第一财经采访时,她表示,在成本、终端等制约因素外,长远看更重要的或许是如何赋予虚拟数字人一个有趣的灵魂,包括它的知识、智慧、个性以及情感。

在这一方面,已经涉及到很多人工智能前沿领域,例如如何在与人的交互当中理解人的感情,和人产生共情,如何产生感情的回应。冯绚认为这是最引人入胜的一部分,也是未来带来更大想象空间的一部分。

在这之后,人工智能结合虚拟数字人可用的场景和可发挥的价值,会有飞跃式的拓展。

推荐内容