AI 数字人:虚实共生的交互新媒介

2025-11-20
来源:融中咨询
AI数字人的发展基于人工智能、计算机图形学与实时渲染等技术的成熟,其核心意义在于成为连接物理世界与数字空间的关键载体,通过可交互的数字化身实现服务流程自动化与用户体验升级,从而推动多行业变革。

核心观点:

  • AI数字人是采用人工智能技术和仿真技术驱动生成的数字化虚拟人物,通常具备人的外观与智能认知能力。根据tecdat analysis的统计数据,目前AI数字人在电子商务领域的应用占比最高,达到了22.7%。
  • 根据IDC披露的数据,2024年中国AI数字人市场规模约41.2亿元人民币,相比2023年增长85.3%;预计到2029年,市场规模将达到250.5亿元人民币,2024-2029年CAGR达43.5%。
  • 国内主要玩家大体上可分为科技巨头派、AI技术派、垂直应用派、创业与新锐派等四个不同的派系类别。其中百度、华为云分别以9.8%、9.7%的市场份额领先于其他企业。
  • 2024年中国Al数字人相关投融资事件数量达33起,投融资金额达到110.56亿元创历年新高。2025年1-5月,中国Al数字人相关投融资事件数量和金额分别达到20起和24.45亿元。
  • 行业面临成本与可扩展性悖论,虽然AIGC技术正在降低制作成本,但要达到电影级效果,成本依然不菲。这导致商业模式难以规模化。要么是“高成本、低销量”的项目制,要么是“低成本、低质量”的SaaS模式,找到兼顾质量与成本的平衡点是一大挑战。

行业概述

(1)定义

AI数字人是采用人工智能技术和仿真技术驱动生成的数字化虚拟人物,通常具备人的外观与智能认知能力。相较于传统的虚拟数字人,AI数字人的生成依靠大量的数据采集与处理,并通过大数据和深度学习等技术实现自主学习和调整。

(2)关键技术

1)数字孪生三维建模技术

数字孪生三维建模技术是一种利用数字技术来创建现实世界中物理系统的虚拟模型的方法。三维建模是数字孪生技术中的一个关键部分,它使用计算机程序将现实世界中的物理系统建模成三维模型。三维建模通常使用计算机辅助设计(CAD)软件和其他专业工具来创建高精度、高保真度的模型。这些模型可以包括各种属性,如几何形状、物理特性、运动、材料属性等。

2)动态脚本生成技术

动态脚本生成技术是一种用于在运行时动态生成和执行脚本的编程技术,它允许开发者在不重新编译和部署应用程序的情况下,通过修改脚本内容来快速调整业务逻辑。

3)多模态交互技术

多模态交互技术是指通过多种感官通道(如视觉、听觉、触觉等)或多种交互方式(如语音、手势、触控、眼动等)与计算机系统进行自然、协同的信息交互。

(3)类型

按图形维度分类,可以分为2D、3D、超写实、卡通等形式。

按照不同的技术分类,可以分成算法驱动型数字人和真人驱动型,算法驱动型就是通过AI实时或者通过一些捏脸来构造出的虚拟数字人形象,真人是通过对幕后真人的动作捕捉的方式对真人的形象进行一个生成。

根据功能和应用场景分类,可以分为服务型数字人和身份型数字人。服务型数字人应用领域广泛,能够用在数字人主播、数字人老师教学、虚拟陪伴等。

表1AI数字人分类

来源:融中咨询

行业发展历程

AI数字人行业主要经历了萌芽与早期探索阶段(1980年-2000年)、技术探索与初步应用阶段(2000年-2010年)、技术突破与快速发展阶段(2010年-2020年)、成熟与广泛应用阶段(2020年-至今),现阶段AI数字人具备智能化的交互能力,已广泛应用于娱乐、教育、医疗、客户服务等领域。

图1AI数字人行业发展历程

来源:融中咨询

萌芽与早期探索阶段(1980年-2000年):数字人的概念最早可追溯至20世纪80年代,当时计算机图形学和人工智能技术的发展为数字人的诞生奠定了基础。这一时期,虚拟人物多以计算机生成图像技术为基础,结合动画和音效设计,呈现出简单的虚拟形象。

技术探索与初步应用阶段(2000年-2010年):随着计算机图形学、动作捕捉、语音识别等技术的进步,数字人开始从简单的虚拟形象向具备交互能力的方向发展。这一阶段,数字人开始具备语音识别、自然语言处理等基础功能,但交互能力仍较为有限。

技术突破与快速发展阶段(2010年-2020年):深度学习、人工智能(AI)和大模型技术的兴起是这一阶段的关键。AI技术的突破使得数字人具备更强的自主学习、情感表达和自然交互能力。生成式人工智能(AIGC)的出现推动了数字人产业的创新,提升了生产效率并推动了规模化发展。

成熟与广泛应用阶段(2020年-至今):AI数字人已发展为具备高度智能化的交互实体,能够替代真人完成多种任务,广泛应用于娱乐、教育、医疗、客户服务等领域。数字人不仅拥有逼真的外貌、行为和情感,还能通过深度学习不断提升响应能力和表现力。

行业全景与市场规模

(1)产业链结构

上游:主要包括芯片制造、传感器、硬件设备等基础元器件供应商及建模、渲染等软件服务供应商,这些企业为AI数字人的研发和生产提供核心硬件及软件支持。

中游:主要涵盖AI数字人的核心技术研发和应用,包括软硬件系统开发、生产技术服务平台搭建、AI能力平台搭建等。这些企业负责将底层硬件与软件技术相结合,开发出具有特定功能的AI数字人产品。

下游:涉及AI数字人的应用和服务市场,包括影视、传媒、游戏、金融、文旅等多个领域,这些企业通过提供定制化服务,推动AI数字人在各领域的广泛应用。

图2AI数字人产业链图谱

来源:信通院

(2)市场规模

根据IDC披露的数据,2024年中国AI数字人市场规模约41.2亿元,相比2023年增长85.3%;预计到2029年,市场规模将达到250.5亿元,2024-2029年CAGR达43.5%。

图3 2023年-2029年中国AI数字人市场规模及增速

来源:IDC

(3)应用落地情况

从市场应用现状来看,在B端市场,金融、泛互联网、传媒、电商零售、政府机构、教育、电信运营商、文化旅游及房地产等行业构成了AI数字人需求的主要来源。主要应用主体在企业级服务,即为企业内外部提供服务,典型的场景有直播数字人、AI短视频内容生产、智能客服、虚拟主播、保险代理人、AI数字员工、虚拟导游、虚拟讲解员等。

根据tecdat analysis的统计数据,目前AI数字人在电子商务领域的应用占比最高,达到了22.7%。

图4 AI数字人在中国各行业渗透率

来源:tecdat analysis

政策与融资动态

(1)政策环境

针对AI数字人行业发展,国家、省市地区均出台了不同的政策。国家层面政策主要强调着力发展AI数字人所需的算力、网络等基础设施等,同时为AI数字人在消费级和行业级应用指明了方向。省市层面政策则从平台建设、数字人生产工具、电商直播、元宇宙新消费场景等更细化的层面提出建设和规范意见。

表9中国AI数字人行业相关鼓励政策

来源:融中咨询

在出台以上政策鼓励行业发展的同时,我国也出台了相应行业监管规范性文件,明确将虚拟偶像、虚拟主播的节目内容纳入与传统内容同等标准的监管体系,提出使用AI数字人的机构主体需要对数字人产生的内容承担全部责任;严格要求AI技术生成内容必须在显著位置进行标识,防止技术滥用,侵犯他人合法权益。

表10 中国AI数字人行业相关鼓励政策

来源:融中咨询

(2)资本动态

中国Al数字人行业正处于投融资活跃期,技术突破、成本下探与政策支持形成合力,推动行业从“工具”向“伙伴”演进。数据显示,2024年中国Al数字人相关投融资事件数量达33起,投融资金额达到110.56亿元创历年新高。2025年1-5月,中国Al数字人相关投融资事件数量和金额分别达到20起和24.45亿元。

图14中国2016-2024年AI数字人行业投融资情况

来源:融中数据

从投资轮次来看,目前中国AI数字人行业融资轮次处于起步和初期阶段,以天使轮、A轮为主,说明行业内新兴企业较多,竞争较为激烈。2024年以来,AI数字人行业主要融资事件如下表所示:

表11 2024年至今AI数字人行业主要投融事件

来源:融中数据

竞争格局与主要参与者

(1)竞争格局

1)国内竞争格局

国内主要玩家大体上可分为科技巨头派、AI技术派、垂直应用派、创业与新锐派等四个不同的派系类别,其中科技巨头派包括百度、腾讯、阿里、网易、科大讯飞等,以B端客户为主,具备强大的生态和技术能力;AI技术派包括商汤科技、小冰公司等,该类型公司从成立之初定位就是人工智能服务商,具备一定的先发优势,其客户类型覆盖B端、C端用户,具备深厚的视觉和CG技术积累。此外,行业中还有一些针对垂直领域应用和特定场景应用的公司,例如蓝色光标、硅基智能、Tiamat等。

表2 国内AI数字人主要企业

信息来源:融资咨询

中国AI数字人市场平台主要参与厂商包括百度、华为云、小冰、商汤科技、追一科技等,其中百度、华为云分别以9.8%、9.7%的市场份额领先于其他企业。

图6 2024年中国AI数字人市场主要厂商市场份额

信息来源:IDC

由于当前市场2D数字人赛道落地迅速,IDC对2D、3D数字人市场进行了切割,根据据IDC披露数据,该细分市场的主要玩家包括华为云、百度、小冰、商汤科技等,其中华为云以12.1%的市场份额遥遥领先与其他企业。

图6 2024年中国2D AI数字人市场主要厂商市场份额

信息来源:IDC

2)国外主要企业

海外主要的AI数字人平台包括UneeQ、Soul Machines、Synthesia、Hour One等。

(2)代表性企业

  • 百度云曦灵

百度曦灵数字人是面向视频、直播方面的AI工具。作为大模型驱动的全模态数字人应用平台,百度曦灵可一站式生成2D真人、3D超写实数字人,支持视频制作、智能对话、直播带货等全场景应用,赋能政企营销获客和对客服务。

图7 百度智能云曦灵数字人平台

信息来源:百度云官网

百度曦灵数字人平台的应用场景包括短视频/直播、虚拟客服、教育培训等,客户以B端为主。百度灵犀免费功能包括基础形象库、语音合成(限时长),收费功能包括3D形象定制、多模态交互、企业级直播SaaS。根据不同的服务项,其收费标准如下:

表3 百度智能云曦灵数字人平台收费标准

信息来源:百度云官网

百度曦灵数字人平台的核心优势主要体现为全栈技术能力(自研大模型+AI能力+云算力)和强大的生态和客户渠道。

  • 腾讯云数智人

腾讯云智能数智人采用语音交互、虚拟形象模型生成等多项AI技术,实现唇形语音同步和表情动作拟人等效果,广泛应用于虚拟形象播报和实时语音交互两大场景。虚拟形象播报根据文本内容快速合成音视频文件,落地于媒体、教育、会展服务等场景,实时语音交互支持即时在线对话,可赋能智能客服、语音助理等场景。

图8 腾讯云数智人平台基本结构

信息来源:腾讯云官网

腾讯云数智人服务内容包括业务办理、用户运营、营销获客、品牌宣传等,服务行业覆盖银行、证券、保险、教育、政务、传媒、文旅、运营商、交通出行等,应用场景包括数智主播、数智客服、数智助手、数智导游、数智代言人等。腾讯云智能数智人售卖三类产品:形象采购、播报服务以及交互服务。形象采购为必选项,可以搭配数智人的播报服务以及交互服务一同使用。

表4 腾讯云数智人收费标准

信息来源:腾讯云数智人官网

  • 阿里云数字人平台

阿里云数字人平台集成了自然语言处理、图形图像、语音等算法能力,提供给客户标准的PaaS接口与后台运营工具,方便客户将数字人能力集成进不同的终端与场景。主要面对的行业包括新零售、政务、金融、运营商、传媒等,场景包括数字人大屏、数字人直播、数字人客服、数字人长/短视频、数字人助理等。

图9 阿里云数字人平台

信息来源:阿里云数字人官网

阿里云数字人平台主要收费项包括3D数字人流媒体、数字人视频合成、2D真人形象定制,目前包含预付费、按量计费两种模式,具体收费标准如下:

表5 阿里云数字人平台收费标准

信息来源:阿里云数字人官网

  • 华为云Metastudio

华为云数字内容生产线Metastudio通过AI学习真人形象和声音,来生成数字人模型,相应功能为形象制作、声音制作和Flexus分身数字人。再将模型用于音视频内容的创作,相应功能为视频制作、视频直播和智能交互,主要是生成画面内容。也可以直接通过静态的人脸照片生成视频,对应功能为照片数字人。

图10 华为云数字人平台

信息来源:华为云数字人官网

华为云数字内容生产线提供分身数字人和3D数字人两种数字人解决方案,其中分身数字人服务项包括模型制作、分身视频制作、分身视频直播、分身视频交互等;3D数字人服务项包括数字人IP制作、3D视频制作、3D虚拟直播、3D海报制作等。

图11 华为云数字人服务清单

信息来源:华为云数字人官网

华为云数字人服务收费标准如下:

表6 华为云数字人平台收费标准

信息来源:华为云数字人官网

  • 小冰公司

小冰公司前身为微软(亚洲)互联网工程院人工智能小冰团队。小冰公司开发的小冰框架已孵化出数以千万计的AI being,既有广为人知的虚拟名人,如少女小冰、Rinna,世博会参展画家夏语冰,歌手何畅、小堂妹,人类观察者MERROR,机器人动漫角色Roboko等;也有数千万个各自不同、陪伴在普通用户身边的虚拟男友、虚拟女友;还有许多在垂直场景里默默工作的虚拟员工和虚拟专家,如冬奥裁判与教练系统观君、每日经济新闻虚拟主播N小黑和N小白、万科集团2021年度优秀新员工崔筱盼、时尚设计师元徕、金融摘要撰稿人万小冰、智能座舱同行者AI小祺和HiPhiGo、时尚设计师西湖一号,以及音乐制作人、金融风控师等。

图12 小冰数字人解决方案

信息来源:小冰公司官网

小冰公司推出"零样本克隆"技术,仅需40秒即可生成数字人分身,根据服务版本不同,收费也有所区分,具体收费标准如下:表7 小冰公司数字人收费标准

信息来源:融资咨询

  • 商汤如影

商汤如影是商汤科技推出的以数字人视频生成技术为核心,基于商汤多种AI生成能力打造的应用平台,包括文本生成、语音生成、动作生成、图片生成、NeRF等。商汤如影AI 视频生成平台,依托“商汤日日新SenseNova”大模型能力,拥有AI文案生成,形象个性化定制,并呈现逼真的口型、表情和动作,帮助企业及个人轻松创作数字人短视频。

图13 商汤如影数字人平台

信息来源:商汤如影官网

商汤如影的收费服务包括会员年包、定制数字人、声音克隆等,具体收费标准如下:

  • 表8 商汤如影数字人服务收费标准

信息来源:商汤如影官网

未来发展趋势

(1)“2D平面”到“3D沉浸”

根据IDC统计数据,2024年中国数字人市场仍以2D数字人为主,市场份额 占比为70.15%。随着VR/AR硬件设备的普及和网络传输技术的进步(5.5G/6G),高质量3D数字人的全息投影交互将成为可能。用户可以与数字人进行“面对面”的立体交互。这种临场感和沉浸式体验的加强特别适用于高端零售、远程医疗、线上教育等需要深度沟通的场景。

(2)从“项目制”到“生态化”

当前,AI数字人行业的主流商业模式仍是项目制,即为客户(主要是大型企业、政府、媒体)提供从形象设计、模型制作到算法训练、系统部署的一站式定制服务。单个项目金额可达数十万至数百万不等。但项目周期长(数月),一旦交付完毕,除非有新的定制需求,否则很难产生持续性收入。目前AI数字人行业正努力从项目制转向SaaS订阅制,SaaS化是生态化的过渡阶段。行业内的头部企业将数字人的核心能力(如驱动、渲染、TTS)产品化、模块化,封装成标准软件服务,客户通过网页或API调用,按需订阅(如按数字人数量、按调用次数、按时长付费)。未来头部企业会最终搭建AI数字人平台,汇聚技术提供方、IP设计师、内容创作者、应用开发者和终端用户,不同的群体都能在平台上创造价值或收获价值。

(3)应用范围将向专业化领域逐渐渗透

目前数字人的应用场景仍以线上娱乐、直播电商等领域居多,未来将加速向金融、政务、医疗、教育、文旅等专业服务领域渗透和深化,服务于更严肃的业务场景。

风险与挑战

(1)成本与可扩展性悖论

超写实、高流畅度的数字人制作与渲染成本极高(百万级),且需要巨大的算力支持。虽然AIGC技术正在降低制作成本,但要达到电影级效果,成本依然不菲。这导致商业模式难以规模化。要么是“高成本、低销量”的项目制,要么是“低成本、低质量”的SaaS模式,找到兼顾质量与成本的平衡点是一大挑战。

(2)C端需求和付费意愿不确定性较强

目前行业主要玩家客户群体以To B或To G为主,虚拟客服、虚拟主播等赛道迅速变得拥挤,功能相似,陷入价格战。企业客户的付费意愿有明确上限。而C端市场方面,除了虚拟偶像(其本身也是高风险行业)和极少数头部应用,普通消费者是否为数字人本身付费仍是一个巨大的问号。付费订阅、打赏等模式是否具有可持续性,仍需验证。

(3)社会伦理及法律风险

由于AI数字人行业属于新兴行业,行业监管还处于持续完善过程中,AI数字人可能面临恶意滥用、隐私安全、责任主体归属、技术性失业等问题。恶意滥用方面,高度拟人化的数字人若被用于诈骗、诽谤、制造虚假新闻、色情内容等,一旦发生重大恶性事件,将对社会造成极大危害。隐私安全方面,在创建数字分身过程中需要采集用户的面部、声音、行为等生物特征数据,这些都是极度敏感的个人信息,若企业保护不当,可能造成用户个人信息泄露的问题。责任主体归属方面,当AI数字人员工造成错误或损失时,其责任由数字人的使用者、开发者、还是模型训练方来承担很难明确界定。技术性失业方面,AI数字人将逐步取代真人主播、客服、主持人等岗位,可能加剧社会的失业焦虑。

第一时间获取股权投资行业新鲜资讯和深度商业分析,请在微信中搜索“融中财经”公众号,或者用手机扫描左侧二维码,即可获得融中财经每日精华内容推送。

融中 热门

您可能也喜欢的文章