核心观点:
云计算经历了资源云化(2006-2013)、云原生化(2013-2020)、算力泛在化(2020-2023)等阶段,随着人工智能与算力网络深度融合,已迈入智算云阶段;
智算云通过AI原生的调度平台,能够高效管理异构算力资源,并支持多租户环境下的弹性伸缩;
智算云是为AI高性能计算提供智算服务,主要以算力使用计费,如九章智算云创新提出“1度算力=312TFLOPS×1小时”的计费模式;
2024年中国国产智算云服务市场规模为161.3亿元,同比增长80.2%;
国内智算云服务市场形成了以传统云厂商、运营商、AI厂商等为主要参与者的竞争格局,其中,AI厂商通过“小而精、深垂直、重落地”的战略模式,在智算云市场中形成了对传统云厂商的有效补位。
(1)定义
智算云指专为AI任务设计,采用高性能硬件(如GPU、TPU)和低延迟网络(如Infiniband),支持大规模并行计算的一种新型云服务模式,广泛应用于AI相关的场景,如智能制造、智能城市、金融服务和个性化推荐系统。
智算云通过AI原生的调度平台,能够高效管理异构算力资源,并支持多租户环境下的弹性伸缩。综合来看,智算云的主要特点为:专注AI高性能计算、异构算力资源池化、支持多租户环境下的弹性伸缩。
(2)组成
智算云通常由四层架构组成,即基础资源层、工程平台层、模型服务层和智算应用层。
基础资源层:提供算网一体化供给的基础设施服务,主要具备AI异构算力调度管理和算力资源虚拟化的功能。
工程平台层:面向各类AI开发者提供工具平台服务,覆盖AI研发、运营、测试等全链条工具和开发环境。
模型服务层:汇聚并开放大模型能力,支持模型微调、推理API调用。
智算应用层:提供覆盖多样化场景的AI应用服务,支持SaaS、私有化、云边协同等应用模式。
图1:智算云组成架构
来源:中国信通院
(3)关键技术
1)算力技术:异构算力资源池化技术
人工智能模型在运行时会涉及多种类型的计算任务,异构算力资源池化技术可以应对计算多样性的问题、并促进算力利用最大化。异构AI算力资源池是指将不同类型和能力的计算资源(CPU、GPU、FPGA、ASIC等)整合在一起,通过智能调度和管理,提供高效、灵活、可扩展的AI算力服务的系统。
图2:OrionX AI算力异构池化软件
来源:趋动科技OrionX
2)存储技术:多级缓存架构
随着 AI 大模型应用及训推场景的爆发式增长,GPU 显存和宿主机内存容量有限、本地及网络持久化存储性能不足等问题凸显。多级缓存通过按速度和容量构建分层缓存体系,可以优化数据访问效率、提升算力资源利用率。其核心思想是:用更快的存储介质缓存热点数据,让高频访问的数据离计算单元更近。
图3:多级缓存的交互流程
来源:阿里云
3)网络技术:互联技术与算网一体
AI大模型以GPU集群分布式训练为基础,要求智算云系统通过卡间互联、机间互联等互联技术构建强大的互联网络,同时依托算网一体技术将计算资源与网络架构深度融合,以满足AI大模型训推对算力基础设施的极致性能需求。
互联技术:主要包括卡间互联与机间互联。卡间互联,是指通过NVLink、CXL等高速接口技术实现同一计算节点内多颗AI芯片间的低延迟数据互通,让芯片间能快速同步模型参数、交换计算中间结果;机间互联则是借助光互连网络、高速以太网等技术构建跨服务器的数据传输通道,解决多台计算节点间大规模数据交互的带宽瓶颈,使分散在不同机器上的模型部件能协同工作。
图4:卡间互联与机间互联
来源:中移智库
算网一体:通过敏捷、可靠、智能、安全的网络设施连接中心和边缘计算设施,实现多层次算力资源统一编排管控,使网络不再仅是数据搬运的管道,更能与计算过程动态协同。例如在数据传输中同步完成预处理、根据网络拓扑优化算力调度路径,甚至让边缘网络节点承担部分轻量化计算任务等。
图5:算网一体架构
来源:全栈云技术架构
4)训练技术:异构混合并行
随着智算集群由万卡向超十万卡规模演进,集群与单厂商绑定存在较大供应链风险,同时技术栈封闭,资源利用率较低,不利于构建良性智算生态。异构混合并行训练技术通过非均匀计算任务切分、高速通信机制实现大模型训练任务在跨架构上的分布式并行加速,以提升多样性算力资源利用率,实现低损耗、高效率的训练。
图6:异构混合并行训练架构
来源:中移智库
(4)类型
智算云从部署模式划分,主要分为公有云、私有云、社区云和混合云。
表1:智算云分类
来源:融中咨询
云计算的发展历程可以追溯到20世纪60年代的分时系统和效用计算等概念,但直到21世纪初,云计算才开始真正兴起并得到广泛应用。云计算经历了资源云化(2006-2013)、云原生化(2013-2020)、算力泛在化(2020-2023)等阶段,随着人工智能与算力网络深度融合,已迈入智算云阶段(当前)。
资源云化(2006-2013):通过虚拟化技术将物理计算、存储、网络资源池化,提供按需、弹性的IT基础设施服务(IaaS),开启了云计算的序幕。2006年Google首席执行官埃里克·施密特首次提出“云计算”的概念,同年亚马逊推出了IaaS服务平台AWS;2009年阿里云创立,2010年微软发布Azure云平台,传统IT企业加速入局。
云原生化(2013-2020):以容器化、微服务架构和动态编排为核心,构建和运行天生适合云环境、可扩展且敏捷的应用(PaaS)。2013年Docker开源容器技术,2014年Kubernetes发布成为容器编排事实标准;2016年阿里云成为全球第三大云服务商;2018年AWS Lambda推动无服务器架构普及,进一步降低开发门槛;2019年天翼云首次进入公有云IaaS市场前三。
算力泛在化(2020-2023):依托算网融合技术(如移动云“算网大脑”),实现中心云、边缘节点与终端设备的全域算力协同调度,支撑低时延场景需求。2020年5G商用加速,中国移动发布“云网一体”技术内核;2022年“东数西算”工程全面启动,推动算力资源跨区域调度。
智能化(2023-当前):AI与云深度融合,云计算从资源供给转向智能生产力平台,提供“算力+数据+模型”一体化服务。2023年AI相关云服务增速超50%[1];天翼云布局全国建设“2+3+7+X”公共智算云池,2024年天翼云“息壤”平台升级为训推一体化智算服务;2025年浙江出台智算云发展政策,目标建成60EFlops公共智算规模,首次以省级政策推动智算云成为AI基础设施[1]。
(1)服务模式
区别于传统云计算的三大服务模式IssS、PaaS和SaaS,智算云在此基础上与AI深度融合升级,形成AI-IssS(基础资源层)、AI-PaaS(工程平台层)、MaaS(模型服务层)和AI-SaaS(智算应用层)四种新模式。
表2:对比AI-IssS、AI-PaaS、MaaS和AI-SaaS
来源:融中咨询
在人工智能体系架构中,MaaS处于应用层和基础设施层之间,与云计算架构相比,对其原有的平台层和应用层进行了增强与补充。
一方面,MaaS增强了平台层能力,首先通过对模型训练框架、工具等进行抽象和服务化,使得用户可以直接构建、使用或基于模型再次调优;同时MaaS-补充了模型层能力,对模型及服务进行集约化管理,为用户提供可直接调取的AI能力。另一方面,MaaS对应用层进行了补充,支持用户基于多种模型服务及组件进行编排或开发。
图7:MaaS定位与比较示意图
来源:中国信通院
(2)商业模式
云计算的商业模式是以资源用量计费为主,可按需提供、按需付费。用户无需自建设施、平台与应用,就可使用相关资源,实现资源的动态调配和聚合[2] 。
图8:云计算产业商业模式对传统IT商业模式的改变
资料来源:慧博投研
相较传统云以CPU时长、存储空间等用量计费,智算云是为AI高性能计算提供智算服务,主要以算力使用计费,如九章智算云创新提出“1度算力=312TFLOPS×1小时”的计费模式。
(1)行业落地情况
从行业应用落地情况来看,2023年以泛互联网、电商为代表的互联网原生行业数字化、信息化程度较为领先,占市场总额的1/3左右。以政务、金融、工业制造为代表的传统行业呈追赶状态,随着“上云用数赋智”理念深入,用云量规模将不断扩张。
图9:中国2023年行业用云量占比
来源:融中咨询
在智能计算服务云化部署方面,2024年图形渲染、AI推理等场景云化部署比例较高,均超过25%,生物科学、科学计算等场景因受其计算范式所限,多使用本地部署的智能算力,云化部署比例在10%-20%之间。
图10:智能计算服务云化部署比例
来源:中国信通院
(2)地区落地情况
从地区用云量来看,截至2024年全国大部分省份已完成初步上云,用云水平深度与数字经济发展成正相关。用云量第一梯队主要集中在京津冀、长三角、珠三角等地,东南地区用云量明显高于中西部地区。此外,公开数据显示部分省份存在云资源供需不平衡的情况,例如贵州、宁夏、内蒙古等省份的供云量远高于其用云量,川渝地区的用云量则高于其自身供云量。
图11:中国2023年31个省(自治区、直辖市)用云量指数
来源:中国信通院
智算云综合了软硬件与平台服务,其产业链覆盖从基础设施、云服务平台及解决方案到行业应用的多层次生态体系。
上游:主要包括相关软硬件及服务器、路由器、中继器等IT基础设施。参与者主要包括寒武纪、华为昇腾等软硬件供应商,浪潮电子、中兴通讯等IT基础设备制造商。
中游:主要包括智算云平台以及其提供的相关服务。参与者主要包括阿里云、腾讯云、华为云、天翼云、移动云、九章云极等云服务提供商。
下游:主要包括公众用户和政企用户两大类,智算云通过终端及服务广泛应用于互联网、金融、公共事业、电信等领域。
图12:大模型产业链图谱
资料来源:融中咨询
随着千亿参数大模型等AI技术的迅猛发展,传统云服务体系在算力、网络架构、服务形态上面临严峻挑战。在此背景下,更适应AI发展的智算云服务市场进入快速增长期。2024年中国国产智算云服务市场规模为161.3亿元,比2023年增长80.2%。
图13:国产智算云服务市场规模
资料来源:融中数据
从服务模式来看,AI推动市场增长点向PaaS、SaaS上移。2023年我国IaaS市场增速达到38.5%,市场总额达3383亿元;PaaS市场达598亿,同比增长74.9%,得益于公有云出海业务及AI发展的需求,预计PaaS领域产品将持续增加;SaaS市场渗透率逐年提升,2023年市场总额达到581亿元,增长率为23.1%。未来,随着AI大模型进入商业落地阶段,预计大量中小型创新企业和投资公司涌入SaaS领域,商业化应用将全面发展[3]。
图14:中国2024年云计算细分领域市场规模及增速(亿元)
资料来源:中国信通院
(1)竞争格局分析
国内智算云服务市场形成了以传统云厂商、运营商、AI厂商等为主要参与者的竞争格局。传统云厂商(如阿里云、腾讯云、华为云、百度云)专注于互联网、金融、制造等高算力场景,通过全栈自研技术和生态开放策略,加速AI平台服务化(AIPaaS),降低企业开发门槛,其优势在于庞大的流量基础、技术迭代速度快、软硬件生态整合及规模效应。三大运营商(移动云、联通云、天翼云)专注点聚焦政务云、央国企云化及安全可控领域,其优势在于政策支持、云网融合能力及国产化算力资源。例如,中国电信天翼云加快构建覆盖全国的公共智算云池,2024年政务云项目中标率超35%[4]。AI厂商在智算云市场中形成了对传统云厂商的有效补位,通过“小而精、深垂直、重落地”的战略模式,抢占政务、工业、金融等关键应用场景。例如,九章云极以自研的智算操作系统和智算云平台为基础,面向大模型训练与推理场景,为高校、科研机构、工业制造、能源等领域提供标准化、可弹性扩展的GPU云服务。
智算云行业属于资金、技术密集型产业,行业进入壁垒相对较高。根据同花顺iFinD统计数据,国内云计算IaaS/PaaS的CR5均超70%,市场集中度较高,龙头企业占据较大市场份额。
图15:laaS、SaaS、PaaS行业集中度(CR5)
资料来源:iFinD
(2)代表企业分析
1)传统云厂商
阿里云:
阿里云是阿里巴巴集团子公司,创立于2009年。阿里云拥有全球化部署能力的通用云计算操作系统“飞天”,可支撑IaaS、PaaS、SaaS及MaaS等全栈云服务,并支持公有云、私有云与混合云等多种部署模式。在“飞天”系统对计算、存储与网络资源的统一调度下,阿里云已构建起覆盖全球70多个国家和地区的内容分发网络(CDN),拥有超过3200个海外边缘节点和2300个国内节点,实现全球内容高速分发能力。
技术上,阿里云具备从底层芯片到平台软件的全栈自研能力,核心成果包括含光AI芯片、倚天710CPU、神龙计算架构以及PAI一站式AI开发平台。
生态控制上,依托阿里集团“云+电商+支付”的业务协同体系,阿里云推进“云钉一体”战略,显著提升了 PaaS 层的盈利能力,其毛利率显著高于行业平均水平,体现出平台级云服务的生态协同效应。
百度智能云:
百度云是百度旗下产品,于2015年正式对外开放运营。百度智能云以“云智一体”为核心战略,融合云计算、大数据与人工智能能力,面向企业与开发者提供全栈式服务与高效开发工具。
在基础设施方面,百度在阳泉建设了亚洲领先的大规模智算中心,为大模型训练和推理提供强劲算力支撑。
在自研技术层面,其核心产品矩阵涵盖自研AI芯片“昆仑芯”、AI大底座模型平台以及百舸AI异构计算平台,构建起从芯片到框架的完整AI技术栈。
此外,百度智能云具备较高的性价比,其AI资源包定价相对较低,为企业智能化转型提供了更具成本优势的解决方案。
腾讯云:
腾讯云成立于2010年,是腾讯集团旗下的云计算与人工智能科技公司。腾讯云构建了“算、存、网、数、安”一体化的全栈智算框架,提供强大的底层技术支撑。算力方面,依托高性能计算集群HCC构建核心算力底座;在存储与网络层,集成自研星脉网络(IHN)与高并发文件系统TurboFS,实现高速数据传输与存储调度。同时,借助TACO加速框架和 qGPU 算力共享技术,进一步提升大模型训练效率与资源利用率。腾讯云的基础设施覆盖了全球五大洲21个地区,运营56个可用区,部署超过3200个加速节点,并具备200T的带宽储备。
在平台能力方面,腾讯云依托专有云平台TCE/TCS提供覆盖数据清洗、模型训练、推理部署的全生命周期AI解决方案。
凭借社交与游戏业务长期积累的高并发技术能力,腾讯云持续拓展企业级市场,并通过“公有云优先”策略和定价优化加快市场渗透。依托微信与企业微信生态,其将AI工具链与SaaS应用深度融合,实现如腾讯会议日志分析等场景的智能化升级。
华为云:
华为云是华为公司旗下的云计算服务品牌。华为云以昇腾AI云服务为核心,构建起从基础设施到应用层的全栈智算能力。华为云代表性产品包括:面向大模型训练的商用超大规模超节点集群Cloud Matrix-384,自主研发的软件开发工具链CodeArts,自主可控的分布式数据库GaussDB,以及完整的云原生安全体系和多行业解决方案。
华为云的核心竞争优势在于全栈技术能力与国产化生态。依托华为在ICT领域超过30年的研发积累,构建起涵盖昇腾AI芯片、鲲鹏CPU、鸿蒙操作系统在内的自主可控技术体系,全面支撑“东数西算”“数字中国”等国家级战略工程。
在政务云领域,华为云已连续七年位居市场份额第一,服务范围覆盖40多个国家部委及省级重大项目。2024年,华为云整体市场份额跃居国内第二,昇腾AI云服务收入同比增长6倍,海外公有云收入增幅超过50%。
金山云:
金山云成立于2012年,2017年起布局AI。依托金山集团资源,金山云在视频云、行业云(如医疗、金融)等场景深耕;依托小米生态的深度赋能,金山云在边缘计算和AIoT领域表现出色。
金山云智算云产品主要包括智算平台、智算网和异构资源管理的专属层。其中,智算平台主要围绕数据平台、训练平台、推理平台及存储平台进行建设;智算网提供多种组网架构,并通过自研的RoCE网络监控平台提供网络视图;服务层整合了服务器、云网络、容器及高性能对象存储和多款Serverless形态数据类产品。
图16:金山智算云产品架构图
资料来源:金山云
通过与小米联合开发“1KM边缘计算”解决方案,金山云将亿级小米IoT设备转化为边缘节点,构建“云+亿级终端”的分布式算力网络,使其在智能家居、车联网等实时数据处理场景中形成技术壁垒。
2)运营商
天翼云:
天翼云是中国电信旗下的云计算品牌,成立于2012年,2024年营收突破1139亿元,超越阿里云登顶国内云服务市场榜首。
天翼云针的核心产品服务以“息壤”算力调度平台、“云骁”云智超一体化平台及“慧聚”一站式智算平台为支柱,构建覆盖全国的“2+3+7+X”智算资源池,通过全栈国产化技术底座支撑政务“慧泽”等垂直行业解决方案。
天翼云差异性竞争优势在于云网融合壁垒和合规优势。天翼云2025年上半年斩获全国65%的政务云订单,在31个省级政务云平台中占据27席;依托中国电信的5.2万个边缘节点和3000余个IDC机房,天翼云可将时延控制在10毫秒内的服务覆盖全国90%县域,实现强大的云网协同能力。
图17:天翼云4.0分布式云技术
资料来源:天翼云
移动云:
移动云是中国移动旗下的云服务品牌。2025年,其工业云平台已接入超过1.2亿台设备,在智能制造领域市场份额达到29%,超越腾讯云,位列行业第三。
在产品体系方面,移动云构建了覆盖 AI-IaaS、AI-PaaS、AI-SaaS 和 MaaS 的全栈服务能力,通过智算平台提供模型开发、训练、部署的一体化支持。同时,移动云依托“算网大脑”实现对全国算力资源的智能调度,提供“一点接入、即取即用”的社会级算力服务。借助边缘智能小站,移动云实现本地数据处理和超低时延响应,满足边缘场景下的高效计算需求。
移动云的核心优势在于其差异化的边缘节点布局与云网融合能力。移动云的“云专网+边缘节点”打包销售策略有效推动5G专网客户转化率提升至58%;同时,通过“算力网络”战略,采用算力并网调度技术,将社会闲置算力利用率从12%提升至35%,显著增强了在AI算力服务市场的资源整合与租赁竞争力。
图18:移动云全国算力资源布局
资料来源:移动云
联通云:
联通云是中国联通集团统一运营的云计算品牌,前身为2013年推出的“沃云”,于2021年正式升级为“联通云”,目前已成为中国专属云服务市场的重要参与者。
联通云的核心产品体系包括星罗算力调度平台、全栈AI平台以及多层次的混合云解决方案。其中,星罗算力调度平台基于联通云7.0全栈底座,支持“中训边推、西训东推”的智能调度策略,实现训练与推理的闭环协同;全栈AI平台整合AICC集群、AICP平台及AI边缘一体机,构建端-边-云融合的AI能力体系;混合云方案基于“央企统一云平台 + 多行业云 + 私有云”架构,提供丰富的行业级应用,具备快速部署能力。
联通云在智算云领域的核心竞争力体现于“云、网、智、安”的一体化架构。其自研AI算力调度引擎支持跨边缘—区域—中心云的智能任务分发;“智链协同云”与“智能视频云”平台广泛应用于政务智能决策、工业视觉质检等场景,实现毫秒级推理响应;“数据安全流通平台”则实现跨域数据的全链路加密传输,基于等保三级与国密算法,构建运营商级安全保障体系。
3)AI厂商
九章云极:
九章云极创立于2013,是一家人工智能基础设施及智算云提供商。公司旗下拥有九章智算操作系统(AIayaNeW OS)、九章智算云(Alaya NeWCloud)等品牌,主要提供面向大模型训练和推理的GPU云服务。
九章智算操作系统(Alaya NeW OS),支持分布式任务调度、容器化部署、异构算力调配、故障感知、跨区域协同等功能,平台同时兼容国内主流GPU/NPU芯片,支持昇腾、天垓、海光、云燧等硬件,在算力国产化、信创生态适配方面具备较强能力。
九章云极提供的GPU云平台支持主流AI框架和多种异构算力资源,具备较强的弹性扩展能力,核心产品九章智算云(Alaya NeW Cloud)基于Serverless架构+强化学习技术,定价策略上创新推出“一度算力”按量计费模式,让算力资源如同水、电、燃气等社会基础资源一样普惠,来满足不同规模用户的精细化使用需求。公司智算云服务覆盖多个垂直应用场景,包括但不限于科研、高校、制造、能源、影视、教育等领域。
图19:九章云极智算中心布局
资料来源:九章云极
总体来看,九章云极以自研的智算操作系统和智算云平台为基础,面向大模型训练与推理场景,提供标准化、可弹性扩展的GPU云服务。其核心优势包括支持Serverless架构、异构资源调度、分布式部署、按需计费、高性价比,以及覆盖多行业场景的广泛适用性。
商汤科技:
商汤科技成立于2014年,其智算云业务主要依托自主研发的SenseCore AI大装置。商汤智算云的SenseCore大装置,硬件层以上海临港智算中心为核心节点,布局全国13个智算节点,构建分布式高性能基础设施;软件层基于自研的“光启”AI原生操作系统,融合“光计算+存算一体”技术架构,实现智能调度与高效资源管理,同时,系统内置联邦学习沙箱,用于提升多方数据协作中的隐私保护能力;应用层则提供“万象平台”,为企业与开发者提供模型管理、推理部署与微调优化等一站式AI服务。
垂直行业应用上,商汤智算云在医疗场景表现突出。其面向医疗行业推出的 SenseCare 平台,依托超过500项AI医学影像相关专利,在多项临床图像识别测试中与西门子医疗等国际领先厂商相比具备明显竞争力。
并行科技:
并行科技成立于2007年,主要为科研和企业用户提供超算和智算算力服务。公司以HPC和AI技术优势及海量算力资源池为依托,打造了“并行智算云”、“并行智造云”、“并行超算云”、“设计仿真云”、“算力调度软件”、“算力运营服务”等核心产品。
并行智算云具有裸金属、高性能集群、云主机和容器等多种产品形态,预置TensorFlow和PyTorch等框架、支持多机多卡调度,配套7×24小时在线专家团队提供AI服务支持,可满足大规模预训练、微调、高并发推理和高精度科学计算中对计算、存储、网络等环节的多样性需求。
并行科技构建了以“应用运行特征”为核心的服务体系,推出“算力买手”模式。该模式通过分析用户应用特征,从全国数百智算中心、上千集群中筛选可用、性能达标且性价比最优的算力资源,并按任务总成本排序推荐,助力用户降本提效。公司提供的算力解决方案主要应用于人工智能、智能制造、生命科学、地球科学、教育科研等领域。
(1)政策环境
近几年,中国陆续出台针对智算云行业的支持性政策,统筹技术研发、基础设施建设和普惠性发展;同时强化国产化替代、数据安全与资源集约管理,并通过绿电配置、分时电价等要求约束能耗,推动低碳化发展。
表3:智算云行业相关支持政策
来源:融中咨询
(2)资本动态
投资活跃度近年来有下降的态势。2016和2017年,中国云计算投资事件数量达到顶峰,均为294件;2019年,中国融资金额达到534亿元,为近年来最大值。2024年投融资事件减少至65起,融资金额下降至45.98亿元,较前几年有较大幅度下滑。反映传统云市场进入存量整合阶段,市场进入更注重质量与价值发展,智算云有望成为新的增长动力。
图20:中国2015-2024年云计算投融资情况
来源:融中数据
未来智算云的发展趋势主要体现在关键技术、产业建设、基础设施等几个方面。
计算技术方面:量子计算、存算一体等技术将成为新型计算范式。量子计算以量子比特为基本单元,利用量子叠加和干涉等原理实现并行计算,能在某些计算困难问题上提供指数级加速,为高算力需求领域提供新方案;存算一体技术将存储与计算完全融合,存储器中叠加计算能力,可以缓解经典冯·诺依曼架构下存储与计算分离导致的“存储墙”问题,系统性提高 AI 芯片算效。
图21:经典计算与量子计算的对比
来源:电子学报
图22:冯诺依曼体系结构与存算一体计算结构对比
来源:电子学报
网络技术方面:泛在算力网络与云边端协同是主要发展方向。随着算力从中心云向边缘延伸,借助5G-A、F5G等网络技术,边缘计算与中心云算力形成动态资源池,实现毫秒级数据交互;通过云边端协同架构,智算云可覆盖工业控制、智慧城市等高并发场景,构建全域算力网络。
图23:基于云边协同的数据通信网络架构
来源:applied sciences
生态建设方面:以“一云多芯”为核心构建开放生态。“一云多芯”是指用一套云操作系统来管理不同架构的硬件服务器集群,可以支持多种类型的芯片。同时,通过开源社区和跨行业协作构建技术标准,配合算力券、模型券等政策支持,促进中小企业上云,整合算力资源,构建多元开放生态。
基础设施方面:互联化升级,万卡级超大规模集群调度技术成为突破重点。上海提出攻关分布式弹性调度系统,目标将万亿参数模型训练周期从数周缩短至数日;中国电信在北京、上海部署液冷DC舱的万卡智算中心,通过“魔方”设计实现高吞吐无损通信;中国信通院牵头成立“万卡智算集群服务推进方阵”,推动全国智算调度网络构建。
第一时间获取股权投资行业新鲜资讯和深度商业分析,请在微信中搜索“融中财经”公众号,或者用手机扫描左侧二维码,即可获得融中财经每日精华内容推送。