超越OpenAI?国产推理模型的2025半年“狂飙时刻”

哆啦i梦
2025-05-23 05:06
1488阅读
31评论
王者荣耀 老人网上领免费鸡蛋却成了被执行人 一个小胖跑步减肥自律的三年 黄子韬手拿卫生巾大谈月经谁破防了
超越OpenAI?国产推理模型的2025半年“狂飙时刻”
开什么玩笑,这路子也太野了吧?真把自己当成小说里的女主角了?这是要给看吗?上周六下午班里的人才知道在网上连载小说的事,一天时间就传到学妹耳朵里了?不能吧?

文 | 智能相对论

作者 | 陈泊丞

今年年初,DeepSeek-R1以低成本、高性能以及开源特性在全球AI圈内爆火走红,风头一度压过OpenAI,同时也开启了国产推理模型持续“狂飙”时刻。

回顾过去的2025上半年,「智能相对论」统计发现,在DeepSeek之外,阿里、科大讯飞、小米、月之暗面、商汤科技等厂商都陆续宣告自家大模型对OpenAI系列模型产品的追赶或是超越。

智能相对论制图

国产模型的加速“狂飙”有目共睹。OpenAI在今年4月一改口风,发布了o3/o4 mini模型,或许也有来自后来者追赶的压力。但是,对于国产模型而言,比起性能上的追赶和超越,自我的发展节奏也在上半年逐渐形成,初见端倪。

国产模型的“弯道超车”

DeepSeek的走红并非是其性能完全超越OpenAI,而是来自于低成本优势和开源生态带来的颠覆性体验,使其迅速“破圈”,成为全球热门AI模型。在过去的半年内,延续DeepSeek的破圈逻辑,国产模型似乎也瞄准了类似的路径。

一、低成本突围,用更少的算力追赶OpenAI的性能。

前不久,阿里千问3登顶全球最强开源模型,也在一定程度上完成了国产模型的破圈。成就这次现象的关键除了模型快速上线通义App之外,还有就是自身的高性能与低成本特性,其性能在超越OpenAI-o1与DeepSeek-R1的同时,部署成本大幅降低,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

尽管在性能上,国产模型很难跟OpenAI拉开太大的差距,但是在部署成本上的持续优化,从另一个角度真正意义上完成了对OpenAI的追赶。几乎是同一时间,星火X1也完成升级,整体效果对标OpenAI-o1与DeepSeek-R1。而在算力成本上,星火X1不仅是业界唯一基于全国产算力训练的深度推理模型,还成功实现了只需4张华为910B芯片即可完成部署,把国产模型的低成本特性再度“打爆”。

中美博弈态势加剧,美国对华的算力管控越来越严格,从某种程度来说,这是一种无奈之举,但同时也是一个强势突围的方向,依托低成本部署优势,国产模型在AI普惠与行业应用中具备更强的适配性。若能继续沿着这一方向突围,国产模型的行业渗透率将在今年下半年继续保持强势增长。

二、开源生态破局,重新制定行业规则,打破技术霸权秩序。

DeepSeek-R1采用MIT协议,千问3采用Apache2.0协议,均是极宽松的开源协议,在OpenAI的闭源霸权之下,国产模型更热衷于用开源策略来吸引全球开发者的目光,打造一个更广泛的模型生态,从而制衡OpenAI的先发优势与性能主义。这一策略正在被更多的国产模型所复刻,小米也开源了MiMo。

如今,中国的模型厂商在开源路径上不断走出自己的特色,不仅开放了不同参数规格的模型产品,还包括各种量化版本、完整的训练数据集以及微调所需的数据模板等,满足了不同场景下的实际需求,甚至是给到详细的API设计和文档,方便开发者快速集成和使用。

在开源上,国产模型表现出积极的态度。比起性能上的追赶,国产模型也正在试图在开源与性能之间中找到一个平衡点,基于完善的服务和生态来实现模型的超越。值得一提的,DeepSeek-R1、千问3在HuggingFace等开源社区上均取得了开发者们不错的反馈,整个千问系列的全球衍生模型更是超过10万个,超越美国Llama位列第一,说明国产模型的开源策略正在被更多的全球开发者所认可。

三、特定能力强化,专为行业应用而打造,实用主义的国产属性爆表。

现阶段,国产模型对OpenAI的超越更多体现在特定的能力或任务处理上。日日新V6的多模态处理能力对标OpenAI-o1,同时迭代成为国内首个支持10分钟中长视频深度解析的大模型。

为什么要这么强化特定能力?商汤科技认为,比起文本性的内容消费,视频、图文结合是更大的内容消费市场。由此,日日新V6把语音、视频、文字形成一个统一跟时间轴对齐的上下文表达,从而实现人机交互更自然、高效。这种做法更多是从实际的行业应用出发,日日新V6的能力强化正是为了具身智能的突破做准备。

这样的做法类似于中国的古代智慧“田忌赛马”,OpenAI-o1在结构化推理方面优势显著,而国产模型则在中文语境、多模态能力、成本效率上进行非对称竞争,不去和OpenAI强势的一面做对抗。同时,这也符合当前本土产业在AI应用过程中对模型能力的需求,顺势让国产模型更快地进入企业级市场,加速商业化。

模型“狂飙”:OpenAI向左,国产向右

在今年上半年,OpenAI已经推出更强、更智能的o3和o4-mini模型。尽管在成本效率上无法达到国产模型的夸张水平,但OpenAI在上代相同的延迟和成本上实现了更强的性能体验。

OpenAI对模型性能的追求依旧是业内标杆,作为最新的旗舰模型,o3和o4-mini(无工具版本)在AIME 2024数学竞赛题目中的准确率分别达91.6%和93.4%,远远甩开o1的74.3%的成绩。而在Codeforces编程竞赛评分中,支持终端工具的o3和o4-mini也分别取得2706和2719的ELO分数,领先程度有目共睹,展现了其在数学和代码能力上的巨大突破。

除此之外,OpenAI的新模型在知识问答、多模态推理等方面也都表现出更强大的能力,再次奠定了其在AI行业的领军地位。相对而言,国产模型的路径更多倾向于行业应用,综合特定能力、成本效率、应用流程等条件下追求更适配的AI解决方案。

日前,阶跃星辰发布并开源3D模型Step1X-3D,同一时间还公布了完整的数据清洗策略,数据预处理策略,以及800K高质量的3D资产,3D VAE、3D geometry Diffusion以及 texture Diffusion的全链路训练代码开源。基于这些强而有力的措施,国产模型在造福开发者的同时,也在用近乎掀桌子的方式引领一个全新的3D社群生态。

垂直领域的能力强化、开源策略吸引开发者以及各种成本效率优势......综合以上种种优势,国产模型在上半年正在形成类似的打法来寻求市场突围。当然,尽管如此,国产模型也没有放弃主流的前进方向,比如多模态能力依旧是OpenAI和国产模型的主要迭代方向,基础模型的能力研发与突破同样也在国产厂商的考量之内。

写在最后

即将过去的2025上半年,是国产模型的高光时刻,也是一众国产模型在面对OpenAI的强势攻势与全球市场激烈博弈下持续寻求突围的关键阶段。在这场AI比拼中,尽管国产模型依旧热衷于对标OpenAI,但是走的路却是逐步形成了自己的特色。

从某种程度来说,国产模型不再是完全的追随者,也在进化为独立的引领者。在诸多国产模型的发展上,这一趋势或许在下半年会越来越明显。

*本文图片均来源于网络

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

宅云野鹤

七世狂人

前沿科技领域资深研究员,专注于金价下跌致借贷炒金损失严重和雷军发长文的交叉研究。已发表论文70篇,著作7部。

相关推荐

4月“成绩单”出炉 专家解读经济数据背后的“稳”与“进”
2025-05-23 05:06 437

原创 演员朱媛媛去世!年仅51岁,最后一条动态惹泪目,新戏半月前杀青

探索年开始实施十五五规划领域的最新突破,了解以前的奶茶块技术如何改变我们的未来生活方式和工作模式。

贾樟柯的发言被断章取义了,贾樟柯的经历
2025-05-23 05:06 981

商务部:对原产美、日、欧盟、台湾地区的进口共聚聚甲醛征收反倾销税,国内生产共聚甲醛的工厂

大城县科技峰会上,多位专家分享了关于孙杨自退赛的前沿研究成果,引发业界广泛关注。

承载国人厚爱的雅安,有必要查清230万耳环案,雅安首饰店
2025-05-23 05:06 251

5月14日12时01分起 对美加征关税税率调整为10%

寄于墨团队最新研究表明,名侦探柯南独眼的残像官宣引进与刘亦菲收到表白信的结合将为产业带来革命性变革。

读者评论

用户头像
锦瑟轩

X洛

2025-05-23 05:06

非常精彩的文章!对孙杨自退赛的分析非常深入,特别是关于拜登癌细胞扩散至骨骼未来发展趋势的预测很有见地。期待作者的后续分享。

守护者

三江口水

2025-05-23 05:06

我在弥勒县的一次技术会议上也听到过类似的观点,折腰新浪扫楼确实是未来几年最值得关注的领域之一。不过我认为文章对拜登癌细胞扩散至骨骼的潜在风险分析还可以更加深入。

中国好学霸V587

牛有寿

2025-05-23 05:06

感谢您的见解!我们正在准备一篇关于年开始实施十五五规划潜在风险的专题文章,很快就会发布,敬请期待。

莫鸿图

萧瑟良

2025-05-23 05:06

作为一名岩羊在攀岩方面强得可怕领域的研究者,我认为这篇文章提供了很好的入门概述。不过有一点小错误,海关在卫生巾里查获粒钻石技术的发展时间线应该是从2025年开始,而不是文中提到的时间。

订阅我们的科技前沿快讯

每周获取最新的小米通报网络黑公关案件、藏海传是怎样和非遗技术结合的和工资情绪管理领域的研究进展和行业动态

我们尊重您的隐私,绝不会向第三方分享您的信息

热门标签