核心观点:
AI编程是当前人工智能领域最有用、用户最愿意付费且增长最快的应用方向之一。它并非简单的提效工具,而是重塑软件生产关系的新基建。
作为一种利用大模型技术来提升软件开发效率的方法,AI编程主要通过自然语言交互、上下文感知和自动化生成能力,实现了代码生成、补全、调试及架构设计的智能化,从而将开发效率推向新的高度。
2024年,中国AI代码生成市场规模约为90亿元人民币,预计到2028年增长至330亿元人民币,年均复合增长率为38.4%。
美国和中国是全球AI编程领域的领先者。美国Claude Code、Cursor和Windsurf形成了三足鼎立的竞争格局,而国内市场则相对分散,当前竞争点主要体现在底层模型能力和工具的整合方式上。
由METR发布的一项随机对照试验得出的结论:在使用AI编程助手时实际耗时反而增加了。这种“生产力悖论”意味着AI编程的真正优势可能不在于缩短核心编码任务的时间,而在于其他方面。例如,减少编写样板代码等枯燥任务的时间,从而将更多精力投入到更高层次的架构设计中。
(1)定义
AI 编程(AI Coding)是指利用人工智能(AI)技术辅助或自动化软件开发的过程,包括代码生成、补全、调试、测试、优化等环节。其核心目标是提升开发效率,降低编程门槛,使开发者能更专注于创造性工作而非重复性编码任务。
作为一种利用大模型技术来提升软件开发效率的方法,AI 编程主要通过自然语言交互、上下文感知和自动化生成能力,实现了代码生成、补全、调试及架构设计的智能化,从而将开发效率推向新的高度。
图1:基于大模型的AI代码生成逻辑
来源:融中咨询
(2)关键技术
机器学习。机器学习技术主要包括监督学习、无监督学习和强化学习。监督学习需要利用带有明确“答案”(标签)的数据进行训练,模型的目标是学习输入特征与输出标签之间的映射关系,从而对新的、未见过的数据做出预测;无监督学习则是处理没有预先标注标签的数据,模型的目标是探索数据内在的结构、模式或关系,其核心在于让数据“自己说话”;强化学习是帮助AI在编程过程中通过不断尝试和反馈,优化代码生成策略。例如,在生成代码片段时,根据代码运行结果的反馈调整生成的代码,以提高代码质量。
图2:机器学习的分类
来源:渤海证券研究所
NLP(自然语言处理)。NLP 是指理解开发者用自然语言描述的编程需求,将自然语言准确转化为编程任务。例如,开发者输入“创建一个计算两个数之和的函数”,NLP技术能提取关键信息并转化为代码生成指令。此外,NLP 技术还包括代码注释与文档生成,即分析代码逻辑,自动生成代码注释和文档,帮助开发者理解代码功能和使用方法。
图3:NLP 主要功能及结构
来源:东吴证券研究所
代码理解。代码理解技术是一个以软件系统为被分析对象,对其内部的信息和运作流程进行分析,获取相关知识信息的技术领域,这些信息可以在 CI&CD 各个阶段被访问和应用。传统的代码理解技术方案主要由代码解析层、代码分析层、应用层三部分组成。代码理解常用的分析手段有静态分析、动态分析、非源码分析和基于LLM的分析。
图4:传统代码理解技术方案
来源:百度
(3)类型
按代码生成功能分类,AI 编程主要包括代码补全、代码生成、代码重构、测试用例生成、代码审查辅助、代码搜索与导航、交互式编程等。
表1:AI代码生成功能分类
来源:民生证券研究所
AI 编程行业主要经历了技术探索阶段(1950s-1990s)、深度学习阶段(1990s-2017)、AI编程阶段(2017至今),现阶段AI编程工具正从简单的代码补全插件(如GitHub Copilot)演变为更全面的AI驱动集成开发环境(IDE)
图5:AI编程行业发展历程
来源:融中咨询
技术探索阶段(1950s-1990s):此阶段以技术探索为主,主要集中在自动化编程领域。1957年,约翰·麦卡锡开发了第一个专门用于AI编程和符号推理的AI软件包“逻辑理论家”。1970s,伴随专家系统兴起,早期工具如Microsoft Front Page允许设计师通过模块化操作创建图形界面,成为无代码的雏形。
深度学习阶段(1990s-2017):无代码普及推进,并向企业级功能拓展。GeoCities(1994年)和WordPress (2003年)进一步推动无代码普及,使非技术人员也能构建网站。2007年,James Martin正式提出“无代码”概念,强调通过自动化技术降低开发门槛。统计学习与IDE集成工具的萌芽,如Eclipse代码补全插件。2010年代后,无代码平台如Bubble、Webflow等开始集成工作流自动化、数据管理功能,支持企业级应用开发。
AI编程阶段(2017至今):AI 深度参与编程全流程,相关工具应用爆发式增长。2017年,“Al for Code”概念形成,AI开始在编程中发挥重要作用,如代码生成、代码优化和错误检测。2019年,OpenAl的Codex模型进一步激发了行业关注,AI编程工具从代码补全跃升为全流程开发助手,甚至进阶到“低代码”和“无代码”编程。2022年ChatGPT催生代码生成工具的爆发式应用,GitHub Copilot用户突破百万仅6个月。
(1)产业链结构
上游:为产业提供基础设施与硬件支撑,涵盖AI芯片厂商(如英伟达、英特尔等,提供算力核心)、IDE及AI开发平台(如微软Azure、阿里云等,是开发环境)、存储器(华为、联想等,保障数据存储)、服务器厂商(如浪潮、中兴等,提供计算硬件)等。
中游:聚技术研发与平台搭建服务,国内主要包含商汤、智谱AI、阿里云等。
下游:经软件集成商,将技术落地到终端用户,覆盖互联网、金融、政务、能源、电信、医疗设备等领域。
图6:AI编程产业链图谱
来源:融中咨询
(2)市场规模
AI编程是当前人工智能领域最有用、用户最愿意付费且增长最快的应用方向之一。它并非简单的提效工具,而是重塑软件生产关系的新基建。基于Menlo Ventures调研, 2024年企业生成式AI用例中,代码占比最高,约成占51%。
图7:2024年企业生成式AI用例中代码占比最高
来源:Menlo VC
中国在本土化与行业场景落地方面更具有优势。2024年,中国AI代码生成市场规模约为90亿元人民币,预计到2028年将增⻓至330亿元人民币, CAGR约为38.4%。
图8:中国AI代码生成市场规模及增速
来源:DBMR
从行业应用落地情况来看,当前AI编程在互联网、游戏中的渗透率已达80%及以上。预计随着AI编程的持续向好发展,其在电信(30%)、政务(15%)等行业的渗透率有望进一步提升。
图9:AI编程在中国各行业渗透率
来源:融中咨询
在具体功能应用中,编写代码以82%的当前使用率高居首位,问题解答(68%)和调试辅助(57%)紧随其后;值得注意的是,开发者对部分未普及功能存在高期待,如部署与监控(41%感兴趣)和项目规划(40%感兴趣),显示运维与管理环节的AI化将是潜在发展重点。
图10:2024年全球开发人员在开发工作流程中最常用的AI功能
来源:Statista
(1)竞争格局
美国和中国是全球AI编程领域的领先者。美国Claude Code、Cursor和Windsurf形成了三足鼎立的竞争格局,而国内市场则相对分散,行业进入壁垒较高,主要包含互联网巨头、科创企业两类。此外,大多数AI编程产品在功能上高度同质化,当前竞争点主要体现在底层模型能力和工具的整合方式上。
表2:全球AI编程相关产品的WEB访问量和月活跃用户数
来源:融中咨询
互联网巨头如阿里、百度、字节跳动等,相继推出通义灵码、Baidu Comate、豆包 MarsCode等产品,在AI编程领域具有技术领先、生态完善、市场影响力强等优势,可投入大量资源进行AI编程工具的研发和推广。
科创企业如卓易信息、智谱 AI、普元信息、商汤科技、金信息等,具有创新性强、产品迭代迅速、定价模式灵活、注重特定场景优化等优势,可针对特定开发场景或编程语言提供定制化解决方案,快速响应特定用户群体的需求。
(2)代表性企业及产品
字节——豆包MarsCode
豆包MarCode是字节跳动2024年推出的基于豆包大模型打造的智能开发工具,旨在为国内开发者和泛人群提供免费的编程服务,包括智能代码补全、生成、优化、注释生成、代码解释和错误修复等。
TRAE是2025年有字节跳动推出的AI原生、中文IDE产品,面向专业开发者,目前已过渡到2.0版本,在AI IDE产品领域抢先占位。1.0 阶段工具聚焦“代码生成”,2.0 阶段以“SOLO”模式实现从需求到部署的全流程工具覆盖,用AI提供完整上下文与工具链支持。
百度——Comate
文心快码(Baidu Comate)是百度基于文心大模型打造的编码辅助工具。从2022 年至今,已从单纯的代码推荐工具向代码生成助手转型,具备自动代码生产、单元测试生成、自然语言生成代码、注释生成以及智能问答等功能。2024 年百度推出 Comate+开放平台,支持企业级定制部署。
Comate AI IDE是于2025年发布的独立 AI 原生开发环境工具,支持AI 辅助编码全流程、多智能体协同、多模态能力增强、首创设计稿一键转代码、MCP 工具接入、开箱即用等功能。其特色功能简易智能,相较字节跳动同类产品而言,非专业者也能适用。
阿里——通义灵码、图像大厨
通义灵码 AI 程序员于2024年正式发布,提供代码智能生成、研发智能问答、任务自主执行等能力。通义灵码 AI 程序员具备良好的兼容性,同时支持 VS Code、JetBrains IDEs 开发工具。通义灵码基于通义大模型,在2025年2月Chatbot Arena 公布的大模型盲测榜单中,Qwen2.5-Max 在数学和编程等单项能力上排名第一。
图像大厨(ImgCook)是阿里巴巴推出的D2C(Design to Code)平台,旨在将各种图像一键生成可维护的前端代码,适用于营销、广告等领域。图像大厨能够识别并解析输入的设计文件,并自动生成包含视图代码、数据字段绑定、组件代码及部分业务逻辑代码的前端代码。
腾讯——CodeBuddy
CodeBuddy 是腾讯云今年推出的智能编程助手产品线,其发展经历了从插件工具到全流程IDE的演进。
CodeBuddy IDE是独立的全流程开发工作台,覆盖产品规划、UI设计、前后端开发到部署的全生命周期。以Plan Agent、Design Agent、Coding Agent、Deploy Agent四大智能体为核心,用户只需用自然语言描述业务场景,AI即可自动生成结构化PRD,包含核心功能拆解和流程逻辑,帮助非技术背景的产品经理、业务人员快速完成产品早期规划。
卓易信息——SnapDevelop
卓易信息成立于2008年,主要为CPU和计算设备厂商提供云计算设备核心固件(BIOS、BMC)产品和服务、为政企客户提供端到端的云服务解决方案。
SnapDevelop 是其全资子公司艾普阳科技于2024年推出的一款国产化低代码IDE产品,采用模型驱动的方式自动生成应用的前后端代码,支持多个可视化设计器、代码自动生成器、AI 助手、可视化测试工具全栈应用开发;同时,SnapDevelop还提供应用项目后续的开发和维护功能,且无技术锁定,相对灵活,用户可根据自己的偏好选择适合的开发方式和工具。
普元信息——EOS Platform
普元信息成立于2003年,是领先的数据治理和低代码技术提供商,全栈式中间件领导者之一。
普元低代码开发平台EOS Platform是企业级“一体化数字应用支撑平台”,整合了包括 AI 助手、快速渲染、分布聚合等的核心技术,具备复杂代码开发、敏捷拖拽开发、流程协同开发、服务集成开发、数据分析开发等多种能力及全生命周期管理工作。相较于业界同类产品,普元低代码平台以复杂业务模型为核心,通过高低代码融合架构面向诸如ERP、MES等复杂业务系统。
商汤——代码小浣熊
商汤科技成立于2014年,专注于提供人工智能软件服务。公司推出的代码小浣熊是基于商汤大语言模型的软件智能研发助手,支持超100种主流编程语言和IDE,覆盖软件需求分析、架构设计、代码编写、软件测试等环节,满足用户代码编写、编程学习等各类需求。
此外,小浣熊家族Raccoon还支持复杂表格、多表格、多文件理解,完成数据运算、比较分析、趋势分析、预测分析和可视化等数据分析任务,能赋能财务、商业、销售市场等多个应用场景。
智谱AI——CodeGeeX
智谱AI创立于2019年,由清华大学计算机系知识工程实验室的技术成果转化而来,是一家专注于人工智能大模型技术的研发与创新的高科技企业。
CodeGeeX是由智谱AI开发的一款智能编程助手,其主要功能包括代码生成与补全、自动添加注释、代码翻译以及智能问答等。此外,CodeGeeX 还拥有代码解释、跨语言对之间的代码翻译等特色功能。CodeGeeX相较同类产品功能强大且广泛应用,其核心优势在于,基于大规模多语言代码生成模型,能够支持多种编程语言之间的代码互译和智能回答技术问题。
硅心科技——aixcoder智能编程机器人
硅心科技成立于2017年,是一家智能化软件开发解决方案技术企业,专注于AIGC for Code领域,孵化自北京大学软件工程研究所。截至2025年,已完成包括B轮、A+轮、A轮、A++等多轮融资。
公司产品aixcoder智能编程机器人,具备issue自动处理、代码库智能问答、全流程代码生成三大功能。同时,公司还发布了国内首个基于深度学习的方法级代码生成模型“aixcoder XL”,能够同时理解人类语言和编程语言生成代码。此外,aiXcoder专注于提供企业级私有化部署服务,例如推出“控制算法代码智能生成工具IPRCoder”,实现AI编程在针对航天领域应用。
(1)政策环境
直接针对AI编程行业的政策相对较少,主要对部分相关产业推行相关政策,间接对AI编程行业开展支持。
一方面,通过《关于推动未来产业创新发展的实施意见》等文件,鼓励利用人工智能、先进计算技术培育高潜能未来产业,释放公共数据标注需求、开展关键技术攻关与产业应用;另一方面,如《生成式人工智能服务管理暂行办法》《人工智能生成合成内容标识办法》等,明确分类分级监管、内容标识等要求,强调发展与安全并重。
表3:中国AI编程行业相关政策
来源:融中咨询
(2)资本动态
随着AI相关技术快速进步,AI代码生成赛道的热度也持续升温,呈现波动增长的趋势,尤其2022年后投融资金额显著增加。2024年投资情况达到近十年内顶峰,投融资事件19起,总投资金额约为112.25亿人民币,较2023年投资金额53.68亿人民币同比增长约109%。
图11:中国2016-2024年AI代码生成行业投融资情况
来源:融中数据
同时,AI编程领域的投融资情况呈现向头部集中、大额融资、高增长性的特点。如智谱 AI2024年共计投融资事件5起,已披露总金额超45亿人民币,展现出该行业较好的发展潜力。
表4:2024年中国AI代码生成行业主要投融事件
来源:融中数据
从投资轮次分析,目前中国AI代码生成行业融资轮次处于起步和初期阶段,2024年天使轮、Pre-A轮、A轮总占比超过50%,说明行业内新兴企业较多,竞争较为激烈。
图12:2024年中国AI代码生成行业主要投融事件轮次分布
来源:融中数据
从地域分布来看,2024年中国AI代码生成行业主要投融事件主要分布北京、广东和上海,呈现高集中分布的特点。
图13:2024年中国AI代码生成行业主要投融事件地域分布
来源:融中数据
端到端自动化。过去,编程自动化局限于单点任务,无代码平台业务逻辑仍需手动配置或有限模块拼接。未来,AI编程推动全流程自动化,从需求分析到代码生成、测试验证再到部署运维形成闭环,即端到端自动化。端到端自动化的核心技术包括多AI Agent协同、可定制化大模型等,其优势在于大幅提升开发效率,减少人为操作误差,保障流程一致性。
规范驱动开发。业界开发者正从随意的“感觉式编码”(Vibe Coding)转向更为严谨的“规范驱动开发”(Spec-Driven Development)。“感觉式编码”指开发者通过自然语言对话来指导AI,这种方式往往缺乏可预测性,难以保证代码质量和架构一致性;而“规范驱动开发”可解决此类问题,其核心思想是,在AI开始编写代码之前,先将高层次的需求转化为一份详尽明确、结构化的书面规范,并成为 “单一事实来源”指导AI后续所有的开发活动。
异步AI编码。过去AI 编程主要依赖于前台的交互式体验,即开发者在 IDE 中直接与 AI 交互,实时生成代码和验证结果。但随着开发基础设施(VSCode Server 等、代码库集成)、上下文引擎和模型上下文协议等的发展,AI 编程正在向后台异步执行转变。例如,通过模型分析需求或开发任务,在后台生成 Plan、代码,甚至是自动化测试脚本。
一是生产力悖论。AI编程的“生产力悖论”主要指由METR发布的一项随机对照试验得出的结论:在使用AI助手时实际耗时反而增加了19%[2],这可能是由于审查与修正的认知开销、过度委托的诱惑等。这个悖论意味着AI的真正优势可能不在于缩短核心编码任务的时间,而在于其他方面。例如,减少编写样板代码等枯燥任务的时间,从而将更多精力投入到更高层次的架构设计中。
图15:开发者预计花费时间(左)和实际花费时间对比(右)
来源:METR
二是规模化适配困难。在面对企业级代码库时,AI 表现明显下降。由于每家公司的代码库都具有独特性,AI 常常生成看似合理但不符合特定企业规范的“幻觉代码”。例如调用不存在的内部函数、违反专属风格规范、破坏CI/CD流水线。此外,传统代码检索常被“同名不同义”的语法陷阱所惑,无法精准匹配所需的功能与逻辑。
三是人机协作瓶颈。现有AI编程助手与开发者的交互模式相对粗放,开发者对AI输出控制力弱,生成的代码多为无结构的庞大数据块,系统缺乏表达自信度的机制,无法标识需要人工复核的代码段;对专业开发工具的支持不足,难以有效运用调试器等专业工具。这些问题导致开发者可能盲目信任那些能通过编译却在运行时出错的代码。
四是评估体系失准。当前主流的 SWE-Bench 评估标准存在明显不足,存在误导技术演进方向、掩盖模型能力缺陷的风险。测试案例通常仅涉及几百行代码,远不及企业级项目的规模;评估场景过于简单,无法捕捉重构大型系统、人-AI结对编程或性能关键型重写等高风险场景的复杂性;更存在数据泄露的风险。
第一时间获取股权投资行业新鲜资讯和深度商业分析,请在微信中搜索“融中财经”公众号,或者用手机扫描左侧二维码,即可获得融中财经每日精华内容推送。