未来趋势:
云厂商自研趋势明显,ASIC芯片增速显著提升:越来越多云厂商如谷歌、亚马逊、Meta等开始大力投入自研AI ASIC,推动数据中心定制ASIC芯片市场高速增长。预计未来GPU依然会是算力芯片的主流方案,但ASIC芯片将随着云厂商的自研进程占据一定的市场份额。
先进封装技术价值凸显,国内积极研发先进封装工艺:在算力需求激增与制程技术进步放缓的背景下,先进封装技术(如Chiplet、COWOS)成为提升芯片性能的关键路径。国产厂商积极布局先进封装工艺研发,为国产算力芯片缩小与国际差距提供契机。
混合AI芯片兴起,终端和云端协同成为未来:混合AI芯片能同时满足AI处理协同终端和云端的需要,并在适当的场景和时间下分配AI计算的工作负载,高效利用资源。随着生成式AI的快速发展以及计算需求的日益增长,混合AI芯片正逐步兴起。
(1)定义
AI算力芯片指专为人工智能(AI)计算领域设计的一类芯片,主要用来满足机器学习、深度学习等复杂计算任务需求,特点是能以更快的运算速度、更低的单位能耗能进行大规模数据处理。
(2)类型
GPU、CPU、FPGA、ASIC是目前主流的四种AI算力芯片类型。它们的主要区别体现在设计架构、设计灵活性、性能与效率、开发难度与成本等方面。其中,ASIC芯片又可分为TPU、DPU、NPU等。TPU即张量处理器,专用于机器学习;DPU为数据中心等计算场景提供计算引擎;NPU即神经网络处理器,在电路层模拟人类神经元和突触,并用深度学习指令集处理数据。
图1:四种芯片在不同评价标准上的分析
资料来源:CSDN技术社区
表1:四种AI算力芯片的区别
资料来源:中科院物理所
(1)发展历程
1)早期阶段(1999-2015年)
1999年,英伟达推出首个图形处理单元GeForce 256,开启GPU并行计算时代,为后续AI算力奠定硬件基础。
此后架构持续迭代:2008年,英伟达发布Tesla架构(G80),首次实现统一着色器模型,采用90纳米工艺,支持大规模并行计算;2010年Fermi架构成为首个完整GPU计算架构,支持浮点标准和融合乘加指令;2012年Kepler架构优化SM单元设计,单个单元CUDA核心数增至192个;2014年Maxwell架构显著提升能效比,通过SMM单元优化逻辑控制效率。
2)中期阶段(2016-2020年)
2016年,英伟达推出专为深度学习的Pascal架构,首次集成NVLink高速互连和HBM2高带宽内存,算力实现突破;同年谷歌发布首代TPU,专为机器学习优化,性能为同期CPU的71倍。
此后大厂自研趋势加速:2017年,英伟达Volta架构引入Tensor Core(张量计算核心),支持混合精度计算,AI吞吐量较前代提升12倍;谷歌同期迭代TPUv2/v3,聚焦云端训练与推理。2018-2020年,亚马逊推出Trainium,微软发布Maia100,Meta开发MTIA芯片;同期华为昇腾910问世,标志国产AI芯片进入市场。
3)现阶段(2022年至今)
2022年,ChatGPT的出现推动全球算力需求爆发式增长。英伟达推出H100芯片,半精度浮点运算性能达1979万亿次/秒,高效支持Transformer模型训练。
此后进入技术密集爆发:国内外各大厂商纷纷发布其自研芯片,英伟达迭代Hopper(H200)和Blackwell架构(GB200),后者算力突破20,000 TFLOPS并采用3D封装;谷歌TPU v6(Trillium)性能较v5e提升4.7倍,能效比提高67%;国内方面,寒武纪思元370、海光DCU系列加速适配大模型训练,国产替代和自主可控战略稳步进行。
(2)未来趋势
1)云厂商自研趋势明显,ASIC芯片增速显著提升。由于AI算力芯片需求量的日益激增,且英伟达垄断全球数据中心GPU市场,在成本、差异化竞争、创新性、供应链多元化等因素影响下,越来越多云厂商如谷歌、亚马逊、Meta等开始大力投入自研AI ASIC,推动数据中心定制ASIC芯片市场高速增长。预计未来GPU依然会是算力芯片的主流方案,但ASIC芯片将随着云厂商的自研进程占据一定的市场份额,在定制化AI运算场景中发挥作用。
2)先进封装技术价值凸显,国内积极研发先进封装工艺。在算力需求激增与制程技术进步放缓的背景下,先进封装技术(如Chiplet、COWOS)成为提升芯片性能的关键路径。目前英伟达选择采用COWOS技术,将GPU与高带宽内存(HBM)集成,有效地缩短了计算中心与内存之间的距离,提升通讯效率。面对复杂的海外环境,国产厂商积极布局先进封装工艺研发,为国产芯片缩小与国际差距提供契机。
3)混合AI芯片兴起,终端和云端协同成为未来。因AI推理的规模远高于AI训练,在云端进行推理的成本极高,AI处理需要同时分布在云端和终端进行,才能有效实现AI的规模化扩展并发挥其最大潜能。混合AI芯片能同时满足在终端和云端的协同工作,并在适当的场景和时间下分配AI计算的工作负载,高效利用资源。随着生成式AI的快速发展以及计算需求的日益增长,混合AI芯片正逐步兴起。
(1)政策
国内有关算力芯片领域的政策以加速国产化替代为核心方向,通过补贴、算力券、税收优惠等手段,鼓励算力芯片行业的自主可控,致力达成绿色低碳、全国算力网络协同发展的目标,并积极拓展算力在工业、医疗等行业的规模化应用场景,全面构建安全可控、高效协同的算力与芯片产业生态。
表2:中国AI算力芯片行业相关扶持政策
资料来源:融中咨询
(2)融资动态
2021年及之前,国内AI算力芯片领域的融资热度呈现攀升趋势;2021年,国内AI算力芯片领域的投资金额达到近10年最高,为249.09亿元,投融资事件数为123起。2022年及之后,国内AI算力芯片领域的融资形势整体呈下滑趋势,主要受宏观经济环境及国际形势影响。
图2:2016-2025H1投融资金额和事件数变化情况
资料来源:融中数据
预计2025年,国内AI算力芯片领域的投融资热度明显回暖,主要受益于大模型技术创新、芯片技术突破、大模型应用层面快速发展以及政策支持。2025年上半年,国内AI算力芯片领域融投资总金额为46.9亿元,投融资事件有30起,与2024年整年度数据基本持平。
上游:主要包含人工智能算法、芯片设计及芯片制造领域。其中,人工智能算法主要包括视觉算法、语音处理算法、自然语言处理算法以及各类机器学习方法。
中游:主要为各大AI算力芯片提供商,包括云端、边缘端和终端芯片提供商。
下游:主要包括云计算与数据中心、边缘计算、消费类电子、智能制造、智能驾驶、智慧金融、智能教育等应用领域。
图3:AI算力芯片产业链图谱
资料来源:寒武纪招股说明书
(1)全球
2023年,全球算力芯片市场规模为1785.89亿美元,同比增长1.1%,占全球总芯片规模的42%。2024-2025年,全球算力芯片产业规模预计以10%以上增幅增长,2025年市场规模或将突破2000亿美元。
图4:全球AI算力芯片市场规模预测
资料来源:融中咨询
GPU是AI服务器算力的基石。根据Statista的数据,2024年全球GPU市场规模为653亿美元,预计2029年市场规模将达到2742亿美元,预计2024-2029年复合增速达33.2%。
图5:2023-2029E GPU全球市场份额预测
资料来源:Statista
(2)中国
2023年,中国AI芯片行业市场规模为1206亿元,2019-2023年年均复合增速为79.90%。2024年,中国AI芯片行业市场规模为1447亿元,预计2025年市场规模突破1700亿元。
图6:中国AI算力芯片市场规模预测
资料来源:融中咨询
国内GPU市场规模占AI算力芯片总市场规模的89.0%。NPU、ASIC、FPGA市场规模占比相对较低,分别为9.6%、1.0%和0.4%。
图7:2024年中国算力芯片市场份额占比
资料来源:融中咨询
(1)全球竞争格局
全球范围内,美国企业为该产业的引领者,英伟达、AMD、Intel、谷歌等巨头占据了大部分市场份额。
GPU市场呈现“一超多强”的垄断式格局,英伟达占据全球绝大部分的GPU市场,AMD、Intel等企业占据剩余主要份额。根据TechInsights数据,2023年全球数据中心GPU总出货量为385万颗,其中英伟达GPU出货量约376万台,占比高达97.67%。
图8:2023年数据中心GPU出货量占比
资料来源:TechInsights
CPU市场目前被Intel和AMD所垄断;FPGA市场呈现“两大两小”格局,Altera与Xilinx市占率共计超80%,Lattice和Microsemi市占率共计超10%;ASIC市场尚未形成明显的头部垄断厂商,主要领导者为谷歌、博通、Marvell等企业。
(2)中国竞争格局
国内AI算力芯片市场主要被国外企业垄断,其中,英伟达占据了约85%的市场份额。国产厂商市占率偏低,且较为分散。
GPU市场依然呈现英伟达和AMD两家独大的垄断式格局,国产GPU厂商的市场份额甚微。英伟达占据国内GPU市场81%的市场份额,AMD占据剩下近19%份额,国产份额不到1%。
图9:2024年国内GPU市场竞争格局
资料来源:融中咨询
CPU市场国外企业占比较多,国产厂商的市场份额较小。其中,英特尔和AMD分别占据了国内CPU市场50%和30%的份额,华为占据的市场份额约为10%。
图10:2024年国内CPU市场竞争格局
资料来源:融中咨询
FPGA市场目前呈寡头垄断竞争格局,国外企业占据80%以上市场份额,国产厂商占据20%左右,代表厂商有紫光同创、复旦微、安路科技等。
图11:2024年国内FPGA市场竞争格局
资料来源:毅达资本
ASIC市场博通市占率位居第一,约为55%,Marvell市占率位列第二,约为13%。寒武纪、华为、阿里巴巴、百度、腾讯等国产企业也在积极布局。
图12:2024年国内ASIC市场竞争格局
资料来源:融中咨询
(3)国内代表性企业
1)华为海思
在AI芯片领域,华为海思研发的昇腾系列采用华为自研的达芬奇架构,广泛应用于国内AI训练和推理。其中,昇腾910系列是华为海思自研的高性能AI处理器芯片(NPU),主要面向大规模深度学习场景,专为云端AI训练和推理设计。最新的昇腾920预计将在2025年下半年正式量产,成为中国推进本土人工智能自主算力芯片的关键角色。
此外,华为在云生态大会上推出了人工智能算力集群解决方案CloudMatrix384(简称“CM384”)。半导体研究和咨询机构SemiAnalysis称,CM384在多项关键指标上实现对英伟达旗舰产品GB200NVL72的超越,算力接近后者两倍。
2)海光信息
海光信息产品主要包括海光通用处理器(CPU)和海光协处理器(DCU)。其中,海光信息DCU属于GPGPU的一种,基于GPGPU架构,兼容通用的“类CUDA”环境,能够较好地适配、适应国际主流商业计算软件和人工智能软件,主要应用于大数据处理、人工智能、商业计算等领域,主要部署在服务器集群或数据中心。
3)寒武纪
寒武纪的产品主要为云端智能芯片及板卡、智能整机、边缘智能芯片及板卡、终端智能处理器IP以及与上述产品配套的基础系统软件,上述产品广泛应用于消费电子、数据中心、云计算等诸多场景。寒武纪目前主要的算力芯片属于ASIC芯片,其中云端智能芯片产品思元590综合性能接近英伟达A100。
4)昆仑芯
昆仑芯前身是百度智能芯片及架构部,在实际业务场景中深耕AI加速领域已十余年。目前,昆仑芯基于自研XPU架构,成功推出两代通用AI计算处理器产品:昆仑芯1代AI芯片、昆仑芯2代AI芯片,及多款基于昆仑芯AI芯片的AI加速卡:K100、K200、R100、R200系列,RG800以及AI加速器组R480-X8。
2025年5月,昆仑芯发布了最新的AI加速卡R200,是基于第二代自研XPU架构开发的推理专用加速卡,主要面向数据中心场景设计。该产品配备硬件视频编解码单元,支持自然语言处理、计算机视觉、语音识别等多元AI任务,通过集成R480-X8加速器组方案,可实现多卡互联下的分布式训练加速。
4)燧原科技
燧原科技专注人工智能领域云端算力产品,提供人工智能加速卡、系统集群和软硬件解决方案,其产品主要应用于泛互联网、智算中心、智慧城市,智慧金融、科学计算、自动驾驶等领域。燧原科技专注于推理卡,2024年6月,燧原科技新一代AI芯片燧原S60量产。燧原S60是一款人工智能推理加速卡,可广泛应用于图像及文本生成等应用、搜索与推荐、文本、图像及语音识别等主流推理场景。
5)摩尔线程
摩尔线程专注于GPU芯片设计和研发,其生产的GPU芯片不仅应用在游戏领域,也在AI训练推理加速、超高清视频编解码、高性能科学计算等领域有得以应用。摩尔线程的核心技术是MUSA架构,支持CUDA兼容性和DirectX12,其产品线包括MTTS80、MTTS3000、MTTS4000等全功能GPU芯片。
6)壁仞科技
壁仞科技是高性能通用GPU芯片的提供商,打造了高性能GPU软硬件体系,其通用GPU产品基于训推一体芯片架构,针对人工智能训练、推理,及科学计算等通用计算场景开发。
2022年8月,壁仞科技发布首款通用GPU芯片BR100系列,包括BR104和BR100两大产品,在核心性能设计标准上,BR100系列采用7nm制程,并应用Chiplet与2.5DCoWoS封装技术。软件方面,壁仞科技发布了BIRENSUPA软件开发平台,包括硬件抽象层、BIRENSUPA编程模型和BRCC编译器等。
7)沐曦科技
沐曦科技致力于为各类应用提供高性能GPU芯片及软件平台解决方案,产品覆盖通用计算和图形渲染,可广泛应用于人工智能、智慧城市、数据中心、云计算、自动驾驶、数字孪生、元宇宙等前沿领域。
沐曦科技拥有全栈GPU芯片产品线,推出曦思N系列GPU产品用于智算推理,曦云C系列GPU产品用于通用计算,以及曦彩G系列GPU产品用于图形渲染,满足“高能效”和“高通用性”的算力需求。
8)景嘉微
景嘉微主要从事GPU及相关产品的研发、生产和销售,相关产品包括图形显控、小型专用化雷达领域的核心模块及系统级产品等。
景嘉微早年主要依靠图形显控产品和小型专用化雷达领域产品在军工领域的应用推动发展。2019年,景嘉微的JM7200图形显示芯片获得首份订单,GPU产品为公司业绩开拓出强劲的第二增长曲线。
9)龙芯中科
龙芯中科主营业务为处理器及配套芯片的研制、销售及服务,主要产品与服务包括处理器及配套芯片产品与基础软硬件解决方案业务。在GPU芯片产品方面,龙芯中科面向服务器及个人计算机领域推出了龙芯3号系列处理器配套桥片,集成了自研GPU。
10)天数智芯
天数智芯是通用GPU高端算力及超级算力系统提供商,其产品包括天垓训练系列和智铠推理系列。天数智芯通用GPU产品支持国内外主流AI生态和各种深度学习框架,已支撑数十个行业数百个场景人工智能大模型落地。
(1)产业政策风险
近年来,我国政府高度重视人工智能与集成电路行业发展,出台了一系列产业扶持政策并大力推动,为AI算力芯片行业创造了有利的经营环境和发展机遇。此外,随着人工智能技术逐步在教科研、金融、交通、能源、医疗健康、大文娱等下游垂直行业实现广泛应用,行业也得到充分受益。如果未来国内人工智能、集成电路行业或者部分AI应用领域的相关产业政策、发展规划发生不利变化,致使算力基础设施领域的投资增速相应放缓,进而影响到行业下游客户的采购需求,将可能造成行业整体收入和主要公司经营业绩出现波动。
(2)市场竞争风险
随着人工智能应用的快速普及,对于人工智能芯片的需求不断扩增,吸引越来越多的行业参与者,市场竞争日趋激烈。国内市场方面,受益于中美科技博弈和国产替代政策推动,近年来我国本土品牌人工智能芯片的市场渗透率已呈显著上升趋势,但总体上仍处于发展相对初期阶段,尚未形成较明朗的竞争格局。
按不同技术路径划分,国产厂商主要包括以海光信息、天数智芯、壁仞科技、摩尔线程等为代表的通用型计算架构(GPU)芯片设计企业,和以华为海思、寒武纪、昆仑芯、燧原科技等为代表的专用型计算架构(ASIC/DSA)芯片设计企业。随着人工智能芯片领域国产替代进程的不断加速,未来可能将有更多国内厂商进入到该市场参与竞争。
(3)供应链安全风险
国产厂商主要采用Fabless经营模式,主要负责芯片的研发、设计与销售,生产环节由专业的外协厂商完成,主要包括晶圆代工厂和封装测试厂,报告期内国产厂商与部分境外供应商进行合作,在重要物料HBM以及芯片研发设计所需的EDA工具和部分接口IP等方面的采购,也涉及主要终端供应商来自于境外的情况。
在中美科技博弈持续升级的背景下,因美国政府相关政策影响,国产厂商目前在先进制程晶圆代工和HBM供应等方面受到不利限制。由于集成电路领域专业化分工的产业结构及较高的技术门槛,其中部分供应商的产品或服务具有稀缺性和独占性,较难在短时间内形成同质量的国产替代。如果未来国产厂商与相关供应商的合作关系发生恶化、中断等情形,或者由于其他不可抗力因素而无法继续进行合作,则将对相关公司生产经营的可持续性构成不利影响。
第一时间获取股权投资行业新鲜资讯和深度商业分析,请在微信中搜索“融中财经”公众号,或者用手机扫描左侧二维码,即可获得融中财经每日精华内容推送。