走进热门商圈的购物广场,屏幕上涌现的虚拟人物正在向你推荐当季的最in商品。对,这个和你对话的小姐姐,或小哥哥并不是一个真的人,她是由AI(人工智能)技术或者CG(计算机图形)技术创造出来的虚拟人。
这几年来,虚拟人已经彻彻底底的“进入”了我们的生活,有代表商家品牌形象的品牌虚拟人,有举办演唱会发表作品的虚拟偶像,甚至有的虚拟人并没有一个可以真实看到的虚拟形象 ,它默默地潜伏在你办公软件、邮件,以及商家/顾客对话系统中。
iiMedia Research(艾媒咨询)提供的市场数据显示,虚拟人产业整体保持稳定增长态势。2021年,中国虚拟人带动产业市场规模和核心市场规模分别为1074.9亿元和62.2亿元,预计2025年分别达到6402.7亿元和480.6亿元。
虚拟人NAVA
其中在中国市场,泛娱乐市场是表现最强势的领域。《2022年上半年中国虚拟人百强榜》的虚拟人形象有洛天依、柳夜熙、嘉然、泠鸢yousa、乃琳等。其中,洛天依排名第一,柳夜熙和嘉然分别为第二名、第三名。
加上2022年成为元宇宙的“元年”,也侧面带动了虚拟形象在大众消费领域的普及,人们开始意识到:虚拟人并非存在在真实的世界当中,他们只存在于数字世界里。
随之也引发了一系列的探讨:除了高颜值,虚拟人是否真的有用,他们背后究竟是什么,能否真的去解决问题……
那些“炫技”的虚拟人
人们对于虚拟人的幻想,其实最早来自于虚拟偶像。可爱,高颜值等属性,构成了人们对她的第一印象。这确实也决定了人们最初就对于虚拟人的概念更多停留在娱乐和情感寄托等领域。
图源:洛天依微博
从技术上,虚拟偶像其实只是虚拟人的方向之一。最有代表性的虚拟偶像是洛天依,2022年已是她出道第十年,她依然可以凭借着在技术和内容上的不断投入,以及这十年与粉丝巩固的“共创式情感”跻身国内最成功的虚拟偶像。
但我们也会发现,十年之久,虚拟偶像不断涌现,但洛天依到现在也有且只有一个,大部分的虚拟偶像几乎面临的都是出道即巅峰——但再而衰,三而竭的局面。
而榜单中的虚拟人“柳夜熙”,其实是典型CG技术的代表,她更像是数字人的范畴。传统CG技术支撑的数字人,开端来自于好莱坞电影特效公司,通常他们采用真人动作捕捉的方式录制,优点在于细节和渲染梗真实,但在制造内容的过程中,耗费大量的人力物力。
图源:百度百科
你会被一场虚拟偶像的表演打动,也会感叹于视频片段里那种细致到脸部毛孔的超写实形象。
可以看到,这两类虚拟人其实采用着不同的技术路线。
关于后者,今天行业大多数公司都使用的是3D建模的技术——如果要对某个人建模,可能需要采集对应用户的3D数据,搭建出一个模型。而3D模型做完之后是一个不能动的模型,接下来可能是找到另外一个人,去绿幕前做动作捕捉,包括跟踪脸部的表情和肢体的动作。动作捕捉之后,再把这些数据绑定到模型的关节点上进行绑定,这样会生成一段原始的视频。最后原始的视频经过单独的修真和后期渲染,最终形成了大家想要看到的虚拟的视频片段。
数字人更像是制作生成一个虚拟人的样貌,但它的内心其实是根据人们的想象演绎出来的。这也决定它在某些方面的上限——比如内容需要定制化生产。
如今更广泛概念的数字人,其实包括了泛娱乐型数字人和企业级服务数字人,在展现形式上,也有图文交互和声音交互的数字人,有真人替代型和身份型虚拟人——但最重要的是,它是否是真人驱动还是AI计算驱动。
虚拟人的背后:一个庞大的技术系统
其实很多前面提到的泛娱乐型虚拟人,都不算是纯AI计算驱动的。当然,这也并非是在否定这类虚拟偶像的价值。
只不过,从计算和技术进步的角度来看,AI和深度学习等技术的突破和介入在很大程度上降低了虚拟人的制作门槛。
虚拟人领域,其实囊括的技术要更多。比如拟人的形象就包括建模、动作捕捉等,而交互能力依赖数字化内容、自然语言处理等;对话系统又往往需要一定的样本学习能力和决策能力。
以前面提到3D建模的技术为例,拟人形象这部分就需要耗费数以百万的成本。但AI技术介入之后,通过数据驱动的专家系统也可以渲染出虚拟人的形象和脸部表情。
这代表打造虚拟人的两种技术路径——以小冰框架的神经网络渲染技术(XNR)为例,打造虚拟人的第一步,需要训练两个专家模型:在大数据上训练语音专家模型,它能理解人类语音。在目标主播数据上训练嘴形专家模型,学习目标主播嘴形与表情以及语音之间的关系。第二步,训练人脸渲染模型,输入是语音,渲染出正确的人脸,该训练过程受到之前两个专家模型的监督。 第三步,驱动过程,输入语音,形成完整的主播视频。
通过采用小冰深度神经网络渲染技术以及小冰框架的小样本学习技术,整个训练过程只需要一周。这种方式的成本应该只是3D模型和CAD技术的几十分之一。
另外,与3D模型应用也不同,依赖技术体系的虚拟人——比如纯AI驱动的数字人,其作用更多体现在企业级服务数字人市场,因为它一定程度上缩短了产业链,比如动捕、渲染、形象库等环节增在被纯AI技术取代。
尤其是在场景上,两者也体现着不同:前者建立的是情感纽带,后者则主要看重它的实用替代价值。
每日经济新闻的主播N小黑/N小白,其实就是虚拟人替代真人劳作的代表。最初连续播放了70天的新闻,竟然没有关注发现它不是真人。而依赖背后的AI技术,“训练”出这样的员工,仅仅用了一周,然后取代了真实的主播,让他们把精力放在更有价值的工作上。
图源:小冰
我们此前介绍过万科总部的一位年度员工——崔筱盼,她也是一名虚拟人,引发讨论的并不只是因为她漂亮的形象,更重要的是她悄悄在万科财务部工作的十个月,展开催办的预付应收逾期单据核销率高达91.44%——甚至超过了财务部的真财务。
图源:小冰
招商集团也有一名虚拟员工招小影,除去外貌上有着和真人一样的形态,她也具备一名真人员工同样的专业领域知识和工作业务自动处理的能力。
图源:小冰
以上的种种案例都来自于小冰公司的AI Being技术框架。这类虚拟人展现的是知识、智慧和价值。更强调在一个好看的皮囊的基础上,赋予虚拟人一个有趣的灵魂。
在众多虚拟人的产业链公司中,小冰提供的就是一个端到端的虚拟人生成体系。自从2013年情感计算立项至今,拥有长达九年的框架技术积累,目前才让小冰的商业化进程得以越来越从容。
最近小冰公司还逆市完成了总额10亿元新融资,宣布用于加速AI Being小冰框架技术研发,将对旗下人工智能数字员工(AI Being Employee)产品线启动年度升级。本次升级加强的技术包括大模型对话引擎、3D神经网络渲染、超级自然语音及AIGC人工智能内容生成。
在小冰公司CEO李笛看来,“人工智能基础研究一直是一场厚积薄发的长跑。”所以,作为一家技术公司,李笛喜欢从技术改变生产的底层逻辑来看待问题,他们没有选择造IP,而是造了一把“锤子”,解决生产,让更多的多样性的虚拟人被市场生产和迭代。
小冰公司也正在迈向一家高效的“虚拟人自动化公司”,它拥有文本、声音、图像的AIGC产品化阵列,并且已经实现了商业化的落地。小冰公司宣布,计划将在未来一个季度内,完成当前小冰框架中运行的全部30万名数字员工升级,进一步巩固数字员工产品线的全球领先地位,推动数字员工普及。