元宇宙之虚拟人产业研究:元宇宙应用或加速_虚拟人需求望提升.docx
《元宇宙之虚拟人产业研究:元宇宙应用或加速_虚拟人需求望提升.docx》由会员分享,可在线阅读,更多相关《元宇宙之虚拟人产业研究:元宇宙应用或加速_虚拟人需求望提升.docx(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、元宇宙之虚拟人产业研究:元宇宙应用或加速_虚拟人需求望提升1. 虚拟人:穿梭于现实与虚拟世界间的重要角色1.1. 定义:数字技术驱动的拟人化形象,元宇宙必备分身一般而言,虚拟人指由 CG 技术构建、以代码形式运行的拟人化形象。笼统地说,虚拟人、数字人、虚拟数字人均指通过 CG 技术创造出的拟人化形象,他们被赋予鲜明的人物设定,以代码与数据的形式在计算设备上运行。严格来说,虚拟人强调其在外观上与真人的相似性;数字人强调其存在于二进制的数字世界中,既可以是根据真人生成的 1:1 数字孪生,亦可以是完全虚构的形象与身份;虚拟数字人则有着更为严格的定义,虚拟数字人具备三大特征:1)拥有人的外观及性格特
2、征;2)拥有通过语言、表情或肢体动作表达的能力;3)拥有识别外界环境、与人交流互动的能力。本文将虚拟人、数字人、虚拟数字人三个概念统称为“虚拟人”。如果将元宇宙比作驶向未来的飞船,那么虚拟人是必要的船票。对于用户而言,虚拟人是任何人进入虚拟世界的必要化身,用户可以根据其喜好设置多个形象迥异的分身;对于经纪公司与 MCN 而言,虚拟偶像比真人违约风险低、公关风险低、管控力更强,因此其有意愿孵化虚拟偶像、虚拟主播;对于服务型企业而言,虚拟主持人、虚拟客服在普通 AI产品的基础上增强了互动体验并有利于塑造品牌形象。1.2. 发展历程:形象写实化、交互多样化,当下步入成长期虚拟人起源于 20 世纪 8
3、0 年代,在 CG、动捕、AI 等技术驱动下步入高速成长期。1)萌芽:通过手绘、化妆打造虚拟人,以实现对美好的向往、对现实的批判。1982 年,动画作品超时空要塞中的女主角林明美凭借动人的歌声与纯真的人设走红,制作方顺势将其包装为歌手并发布个人音乐专辑,林明美因此成为全球首个虚拟偶像,也是全球首个虚拟人。2)探索:随着 CG、动捕等技术问世,虚拟人在影视娱乐领域的应用进一步拓宽。自 20 世纪 80 年代以来,CG(计算机图形技术)、动作捕捉、面部捕捉等技术的快速发展为好莱坞电影带来深刻的变革,以数字技术为支撑的景观电影逐步取代叙事电影成为最受欢迎的类别。2007 年,初音未来在VOCALOI
4、D 语音合成技术的加持下诞生,成为首个闻名世界的虚拟偶像,其热度延续至今。3)初级:虚拟人形象越发逼真,AI 技术的发展使其开始向智能服务领域延伸。近五年来,自然语言处理、语音识别、计算机视觉等 AI 技术在虚拟人中的应用不断加深,具有智能交互能力的虚拟人崭露头角。例如,2018 年搜狗与新华社联合发布的虚拟主持人以高仿真形象示人,可对用户输入的新闻文本进行语音播报;2019 年,浦发银行首位虚拟员工“小浦”在服务客户时可感知对方情绪并辅之表情和手势,且具备主动学习、持续提高服务效率的能力。4)成长:技术、需求均迎突破,虚拟人成果井喷。2019 年,视觉特效公司数字王国的软件研发主管 Doug
5、 Roble 在 TED 演讲中完美呈现其 1:1虚拟化身 Digi Doug,在高度还原本人外貌的前提下完成实时动捕,成为高保真虚拟人的里程碑事件。自 2020 年以来,虚拟偶像凭借独特的人设加速吸引年轻群体,以“会捉妖的美妆达人”柳夜熙为例,其在 2021 年10 月 31 日发布第一条抖音短视频后迅速获赞 300 万、涨粉超 100 万。根据虚拟人制作技术及其在市场上的形态,可总结出一套通用系统框架。由于虚拟人的发展尚处于成长阶段,目前仍未形成统一的系统框架,但根据虚拟人制作技术及其在市场上的形态,人工智能产业发展联盟总结出了一套通用系统框架。根据该框架,虚拟人一般由五个模块构成,其中人
6、物形象基于建模技术,语音生成模块基于 AI 技术,动画生成模块基于动作捕捉或 AI 技术,音视频合成显示模块将语音和动画部分结合以呈现给用户;交互模块为扩展项,一些侧重于展示的虚拟人不具备交互能力(如小红书、微博等平台上的虚拟 KOL),而强调交互的虚拟人可通过语音语义识别等 AI 技术或真人操控来完成与用户的交互。真人驱动型虚拟人多应用于泛娱乐领域,智能驱动型虚拟人多应用于服务领域。具有交互能力的虚拟人可进一步划分为真人驱动型、智能驱动型两类,其中真人驱动型虚拟人是在完成原画建模和关键点绑定后,由佩戴动捕设备或特定摄像头的真人实时驱动,除设备购置外无其他技术成本,且互动感更为亲切,因此现阶段
7、可交互虚拟人以真人驱动型为主,并在虚拟偶像、虚拟主播等娱乐领域广泛应用。智能驱动型虚拟人旨在简化各类业务流程以提升企业运作效率,作为当下尖端基础技术的集合体具备初始投入高、未来边际成本低的特质,因此目前着手开发此类虚拟人的企业多为百度、腾讯、搜狗、三星等大厂。2. 技术方案:建模、AI、动捕、渲染是四大关键2.1. 建模:3D 建模技术成熟,动态光场指引新方向在虚拟人通用系统框架背后,建模、AI、动捕、渲染是四大关键技术。3模技术与动画制作软件已发展较为成熟,广泛应用于电影、游戏等领域。早期的 3D 建模技术以结构光扫描为主,虽可实现毫米级重建精度,但过长的扫描时间导致其难以对运动目标进行较好
8、地刻画,近年来高速发展的多相机阵列技术克服了以上问题,成为当下主流的 3D 建模技术。以国内领先企业凌云光为例,该公司自主研发的高精度人脸 3D 建模系统可满足 20-140 台相机的高精度同步、快速拍摄与存储,由此获得的人脸模型可精确到皱纹、毛孔等细节。客户在获得模型的 3D 格式数据后,可进一步利用 Maya 等工具集对其进行处理以生成 3D 动画。光场技术对光影效果的高质量呈现使其成为建模新方向,在VR/AR头显上的应用亦有望改善用户体验。光场可以测量三维世界中各个方向上流动的光,基于此特点动态光场重建技术可以更好地呈现不同观看视角下事物的光影效果,为 3D 建模提供更加丰富的图像信息,
9、近年来微软、Google 等企业均积极探索该项技术在 3D 建模中的应用。此外,光场技术在 VR/AR 头显中的应用可以使头显模拟出人眼感知光线和聚焦的方式,从而呈现出更自然的观感,2021 年 4 月头显技术创业公司 CREAL发布的 VR 头显便采用光场显示器与中心凹结构,与大多数采用基础 3D显示技术的 VR 头显相比,CREAL 头显可以使用户在任何场景任意距离自动对焦,或显著改善由长时间佩戴设备导致的眩晕感。2.2. AI:人机交互成长性高,文娱领域应用有望成为新蓝海人工智能技术在政府城市治理和运营、制造等领域的应用趋于成熟,但在文娱领域的应用仍处于初级阶段。根据艾瑞咨询数据,政府城
10、市治理和运营(公安、交警、司法、城市运营、政务等)是 AI 技术的主要应用领域,2020 年贡献收入占整体市场比例达 49%,其次为互联网、金融,份额分别达 18%、12%;艾媒咨询亦显示,AI 技术在安防、制造、金融等领域已有成熟应用,且市场体量较为可观。与上述成熟应用相比,AI技术在文娱、医疗、农业等领域的渗透率仍然较低,分支技术的突破与发展将成为改写行业份额格局的关键驱动因素。从分支技术来看,人机交互产业规模高速增长,虚拟主播、数字员工等虚拟人应用打开市场空间。近年来随着深度学习算法不断优化、算力大幅增加,计算机视觉、自然语言处理等分支技术取得突破性进展,基于自然语言处理技术的人机交互产
11、品及服务因此实现高速增长。2020 年人机交互核心产品规模有望同比增长 60%至 58.5 亿元,2019-2025 年 CAGR 有望达 36.5%,带动相关产业规模同比增长 94%至 486.9 亿元,2019-2025 年 CAGR 有望达 36.7%,增速显著高于 AI 技术大盘。现阶段人机交互技术主要用于实现金融、电信、电商等领域的客服及售后功能,虽可缩减成本、提高效率,但产品与 C 端用户的互动较为生硬、附加值偏低。与之相比,以虚拟主播、数字员工为代表的虚拟人将客服答疑、智能营销等多种功能合而为一,并有助于塑造客户品牌形象,有望成为人机交互产品的价值突破点。除了打造语音交互功能外,
12、AI 技术还可用于虚拟人的“捏脸”环节,网易伏羲是相关研究的拓荒者。满足玩家个性化需求的“捏脸”系统自单机游戏上古卷轴 3开创以来流行至今,现已广泛应用于天涯明月刀逆水寒等 MMORPG 游戏。在近 20 年的发展历程中,“捏脸”系统可供玩家调节的参数类型不断扩充,在提升个性化程度的同时亦大幅增加了“捏脸”环节的复杂程度。为了让玩家轻松定制专属虚拟形象,2019 年 5 月网易伏羲 AI Lab 携手密歇根大学发明面部捕捉深度学习算法 MelnGame,仅需玩家上传一张人物肖像照片就可以生成虚拟面部的形状和纹理,与此同时该算法还会根据游戏年代设定调整面部特征,现已在逆水寒永劫无间等游戏中得到应
13、用。网易伏羲 AI Lab 负责人李仁杰表示,未来 MelnGame 不仅会在 3D 游戏中广泛应用,还能促进更多社交活动从面对面走向网络化,其预测已在 2021 年 8 月网易伏羲发布的沉浸式活动系统“瑶台”中得到初步验证。2.3. 动捕:高精度与低成本相悖,视觉捕捉或成性价比之选动作捕捉是让虚拟人“动起来”的核心技术,现存三类方案各有优劣。按照实现方式的不同,动作捕捉技术可分为光学捕捉、惯性捕捉、视觉捕捉三类,其中光学捕捉通过摄像头对演员身上粘贴的马克点进行追踪来捕获演员动作,该方式可实现多目标同时捕捉,但对环境要求,且造价高昂;惯性捕捉的硬件基础是 IMU(惯性测量单元),通过算法计算I
14、MU 在特定骨骼节点上的运动轨迹来实现动捕,该方案成本相对低廉,但精度较低,且会随着使用时间的增加累积误差;视觉捕捉以新兴的计算机视觉技术为底层技术,较上述两类方案而言更简单易用、成本更低,但与此同时算法开发难度大、精度难以得到保障。总而言之,现存方案各有优劣,难以兼顾高精度与低成本。(报告来源:未来智库)三类动捕方案适用于不同场景,视觉捕捉或成为虚拟偶像的性价比之选。三类动捕方案的差异导致其应用场景存在差异,目前光学捕捉多应用于医疗、运动、电影等专业领域以及对高精度、低延迟要求较高的舞台,惯性捕捉在影视作品中亦有较多应用,视觉捕捉则更多地应用于消费级市场。以虚拟偶像的动捕为例,光学捕捉可以完
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 宇宙 虚拟 产业 研究 应用 加速 需求 提升
限制150内