超越OpenAI？国产推理模型的2025半年“狂飙时刻”

开什么玩笑，这路子也太野了吧？真把自己当成小说里的女主角了？这是要给看吗？上周六下午班里的人才知道在网上连载小说的事，一天时间就传到学妹耳朵里了？不能吧？

文 | 智能相对论

作者 | 陈泊丞

今年年初，DeepSeek-R1以低成本、高性能以及开源特性在全球AI圈内爆火走红，风头一度压过OpenAI，同时也开启了国产推理模型持续“狂飙”时刻。

回顾过去的2025上半年，「智能相对论」统计发现，在DeepSeek之外，阿里、科大讯飞、小米、月之暗面、商汤科技等厂商都陆续宣告自家大模型对OpenAI系列模型产品的追赶或是超越。

智能相对论制图

国产模型的加速“狂飙”有目共睹。OpenAI在今年4月一改口风，发布了o3/o4 mini模型，或许也有来自后来者追赶的压力。但是，对于国产模型而言，比起性能上的追赶和超越，自我的发展节奏也在上半年逐渐形成，初见端倪。

国产模型的“弯道超车”

DeepSeek的走红并非是其性能完全超越OpenAI，而是来自于低成本优势和开源生态带来的颠覆性体验，使其迅速“破圈”，成为全球热门AI模型。在过去的半年内，延续DeepSeek的破圈逻辑，国产模型似乎也瞄准了类似的路径。

一、低成本突围，用更少的算力追赶OpenAI的性能。

前不久，阿里千问3登顶全球最强开源模型，也在一定程度上完成了国产模型的破圈。成就这次现象的关键除了模型快速上线通义App之外，还有就是自身的高性能与低成本特性，其性能在超越OpenAI-o1与DeepSeek-R1的同时，部署成本大幅降低，仅需4张H20即可部署千问3满血版，显存占用仅为性能相近模型的三分之一。

尽管在性能上，国产模型很难跟OpenAI拉开太大的差距，但是在部署成本上的持续优化，从另一个角度真正意义上完成了对OpenAI的追赶。几乎是同一时间，星火X1也完成升级，整体效果对标OpenAI-o1与DeepSeek-R1。而在算力成本上，星火X1不仅是业界唯一基于全国产算力训练的深度推理模型，还成功实现了只需4张华为910B芯片即可完成部署，把国产模型的低成本特性再度“打爆”。

中美博弈态势加剧，美国对华的算力管控越来越严格，从某种程度来说，这是一种无奈之举，但同时也是一个强势突围的方向，依托低成本部署优势，国产模型在AI普惠与行业应用中具备更强的适配性。若能继续沿着这一方向突围，国产模型的行业渗透率将在今年下半年继续保持强势增长。

二、开源生态破局，重新制定行业规则，打破技术霸权秩序。

DeepSeek-R1采用MIT协议，千问3采用Apache2.0协议，均是极宽松的开源协议，在OpenAI的闭源霸权之下，国产模型更热衷于用开源策略来吸引全球开发者的目光，打造一个更广泛的模型生态，从而制衡OpenAI的先发优势与性能主义。这一策略正在被更多的国产模型所复刻，小米也开源了MiMo。

如今，中国的模型厂商在开源路径上不断走出自己的特色，不仅开放了不同参数规格的模型产品，还包括各种量化版本、完整的训练数据集以及微调所需的数据模板等，满足了不同场景下的实际需求，甚至是给到详细的API设计和文档，方便开发者快速集成和使用。

在开源上，国产模型表现出积极的态度。比起性能上的追赶，国产模型也正在试图在开源与性能之间中找到一个平衡点，基于完善的服务和生态来实现模型的超越。值得一提的，DeepSeek-R1、千问3在HuggingFace等开源社区上均取得了开发者们不错的反馈，整个千问系列的全球衍生模型更是超过10万个，超越美国Llama位列第一，说明国产模型的开源策略正在被更多的全球开发者所认可。

三、特定能力强化，专为行业应用而打造，实用主义的国产属性爆表。

现阶段，国产模型对OpenAI的超越更多体现在特定的能力或任务处理上。日日新V6的多模态处理能力对标OpenAI-o1，同时迭代成为国内首个支持10分钟中长视频深度解析的大模型。

为什么要这么强化特定能力？商汤科技认为，比起文本性的内容消费，视频、图文结合是更大的内容消费市场。由此，日日新V6把语音、视频、文字形成一个统一跟时间轴对齐的上下文表达，从而实现人机交互更自然、高效。这种做法更多是从实际的行业应用出发，日日新V6的能力强化正是为了具身智能的突破做准备。

这样的做法类似于中国的古代智慧“田忌赛马”，OpenAI-o1在结构化推理方面优势显著，而国产模型则在中文语境、多模态能力、成本效率上进行非对称竞争，不去和OpenAI强势的一面做对抗。同时，这也符合当前本土产业在AI应用过程中对模型能力的需求，顺势让国产模型更快地进入企业级市场，加速商业化。

模型“狂飙”：OpenAI向左，国产向右

在今年上半年，OpenAI已经推出更强、更智能的o3和o4-mini模型。尽管在成本效率上无法达到国产模型的夸张水平，但OpenAI在上代相同的延迟和成本上实现了更强的性能体验。

OpenAI对模型性能的追求依旧是业内标杆，作为最新的旗舰模型，o3和o4-mini（无工具版本）在AIME 2024数学竞赛题目中的准确率分别达91.6%和93.4%，远远甩开o1的74.3%的成绩。而在Codeforces编程竞赛评分中，支持终端工具的o3和o4-mini也分别取得2706和2719的ELO分数，领先程度有目共睹，展现了其在数学和代码能力上的巨大突破。

除此之外，OpenAI的新模型在知识问答、多模态推理等方面也都表现出更强大的能力，再次奠定了其在AI行业的领军地位。相对而言，国产模型的路径更多倾向于行业应用，综合特定能力、成本效率、应用流程等条件下追求更适配的AI解决方案。

日前，阶跃星辰发布并开源3D模型Step1X-3D，同一时间还公布了完整的数据清洗策略，数据预处理策略，以及800K高质量的3D资产，3D VAE、3D geometry Diffusion以及 texture Diffusion的全链路训练代码开源。基于这些强而有力的措施，国产模型在造福开发者的同时，也在用近乎掀桌子的方式引领一个全新的3D社群生态。

垂直领域的能力强化、开源策略吸引开发者以及各种成本效率优势......综合以上种种优势，国产模型在上半年正在形成类似的打法来寻求市场突围。当然，尽管如此，国产模型也没有放弃主流的前进方向，比如多模态能力依旧是OpenAI和国产模型的主要迭代方向，基础模型的能力研发与突破同样也在国产厂商的考量之内。

写在最后

即将过去的2025上半年，是国产模型的高光时刻，也是一众国产模型在面对OpenAI的强势攻势与全球市场激烈博弈下持续寻求突围的关键阶段。在这场AI比拼中，尽管国产模型依旧热衷于对标OpenAI，但是走的路却是逐步形成了自己的特色。

从某种程度来说，国产模型不再是完全的追随者，也在进化为独立的引领者。在诸多国产模型的发展上，这一趋势或许在下半年会越来越明显。

*本文图片均来源于网络

此内容为【智能相对论】原创，

仅代表个人观点，未经授权，任何人不得以任何方式使用，包括转载、摘编、复制或建立镜像。

部分图片来自网络，且未核实版权归属，不作为商业用途，如有侵犯，请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能十万个为什么》