DeepSeek正在杀死国产大模型

以下文章来源于技术领导力 ,作者 Mr.K

  导读   

中国创业公司的 3 年存活率,大约是 10%,AI 创业公司只会更低,DeepSeek 的出现,加速了国产大模型公司的生死战。短短的两年半,从 " 百模大战 " 到 " 十模共生 ",就连被给予厚望的大模型 " 六小虎 ",其中两虎已经宣布退出基模的研发。

作者 | Mr.K,科技博主

来源 | 技术领导力  管理智慧 AI+

国产大模型公司之间的竞争相当惨烈,并且还没有到终局,本文就来聊一聊,近期对大模型产业的观察与思考。

01

基础大模型,开始进入可用阶段

1、Agent爆发,标志着基模进入可用阶段

人工智能科学家吴恩达,曾提出 Agent 的四个核心要素:反思、工具调用、规划和多智能体协作。比如,一个电商 Agent 能根据用户需求自动比价、生成购物清单、跟踪物流;一个医疗 Agent 能分析病例、辅助诊断、制定治疗方案,等等。而 Agent 的核心能力 " 反思 ",本质上则是依赖大模型的推理和深度思考能力 。

2025 年被称为 Agent 元年,各种 Agent 已遍地开花,从钉钉智能客服,到字节的扣子空间,再到百度心响 App,以及刚刚融资 5 亿的 Manus。Agent 兴起不仅仅是一个趋势,更是基础大模型能力达到一个临界值的标志。只有大模型具备了足够强的理解、推理和决策能力,才能支撑起现实世界中的各种应用场景。同时这也意味着,基础大模型开始从研究、炫技阶段,迈入可用、产业化的新阶段。

2、基础大模型公司,不超过 3家

李开复曾公开表示,最终基础大模型公司可能也就 2-3 家,其实道理很容易理解,基础大模型是典型的技术密集、资本密集、数据密集型行业,壁垒极高,马太效应非常明显。训练一个顶尖大模型,动辄需要上万张高性能 GPU,数月乃至更久的训练时间,海量的优质数据,以及顶尖的算法科学家团队。这样的投入,堪比 " 军备竞赛 ",小玩家根本上不了牌桌。这一特点也基本注定基础大模型的终局 ---- 只会留下极少数的基础大模型 " 寡头 "。

02

盘点国内 " 第一梯队 " 基础大模型

根据 K 哥的观察以及行业内的普遍共识,目前国内基础大模型第一梯队玩家,大致有以下几家:

1、阿里Qwen:开源生态的 " 基建狂魔 "

比如,淘宝用通义千问优化推荐算法,有效提升用户转化率;夸克推出的 AI 作业助手,覆盖 K12 教育场景。更关键的是,阿里云未来三年投入 3800 亿建设 AI 基础设施,自研的 " 光系列 " 芯片和液冷数据中心,为模型训练提供了底层保障,让大模型成为水电煤一样的基础设施,也让自己的全栈技术布局,成为别的企业难以逾越的护城河。

2、深度求索DeepSeek:用工程创新 " 掀翻桌子 "

火爆出圈的 DeepSeek,则是凭借惊艳的工程创新,在大模型江湖杀出一条独特血路。它搞出降秩 KV 矩阵,搭配混合专家架构,参数数量直接砍掉约 60%,算力消耗大幅削减,训练成本低至行业头部模型的 1/10。还有它的 GROP 算法强化学习,跳过传统 SFT 微调,用 " 模糊思考 + 精确证明 " 的训练套路,让数学、代码生成任务上表现无可挑剔,在 LMSYS Org 榜单夺魁。

更具前瞻性的是 DeepSeek 的开源策略,不仅构建起了以中国为圆心的全球 AI 生态,还在其他公司追求 " 更大更强 " 之际,用自己的技术实力和战略眼光开辟了 " 更省更快 " 的新赛道,直接 " 颠覆 "API 定价,把 AI 服务从高端 " 奢侈品 ",变成大众用得起的 " 日用品 "。

3、字节豆包:流量加持的" 全能选手 "

一个典型案例是 " 豆包 AI 助手 " 的迭代:初期只是简单的聊天机器人,如今已能根据用户输入的文字生成短视频脚本、自动剪辑视频,甚至通过分析用户表情推荐内容。这种 " 流量 + AI" 的闭环,让字节的模型训练拥有天然优势。此外,字节在视频生成、实时交互等领域的技术突破,也在一步步重新定义和拓展 " 内容创作 " 的边界。

4、百度文心大模型:搜索巨头的 AI  涅槃

百度是国内最早布局大模型的公司之一,文心大模型已经迭代到 ERNIE 4.0 版本。其核心优势在于 " 搜索 + 大模型 " 的深度融合。比如,用户搜索 " 如何煮咖啡 ",文心大模型不仅能给出步骤,还能生成对应的视频教程、推荐咖啡豆购买链接。这种 " 内容 + 服务 " 的一体化能力,让百度在 To C 场景中占据先机。网盘、文库、地图等国民级应用,几乎都用 AI 重新做了一遍,而且商业上的表现格外亮眼,是国内第一批找到 PMF 的 AI 产品。

此外,百度还在努力破圈,实现大模型的落地应用。比如,在工业领域,百度与三一重工合作探索设备智能化维护。在政务场景中,百度依托文心大模型为某地区打造 " 政务云脑 ",提升服务效率等。这家老牌大厂正持续发力,努力为自己在 AI 时代扳回一城。

03

中国需要更多 DeepSeek

除了以上四家大模型公司 ,国内 AI 圈还有一批极具潜力的 " 后浪 " 在奋力追赶,试图在基础模型或其核心能力上实现突破,成为下一个 "DeepSeek"。

1、智谱 AI:开源 + 闭源,生态完整

背靠清华大学知识工程实验室,智谱 AI 带着浓浓的 " 学院派 " 基因。它的 GLM 系列模型在中文问答、代码生成领域表现优异,其所坚持的 " 开源 + 闭源 " 双轮驱动策略,更是捷报频传。

开源方面,智谱 2025 年大手笔开源多款模型,吸引全球开发者挖掘潜在问题、贡献优化思路,模型性能也因此一路飙升;闭源商业化同样风生水起,2024 年中标 32 个政府及企业项目,揽金 1.29 亿元。在金融、医疗、政务等 20 多个行业里,智谱的模型都成了核心生产力工具。

智谱的发展如同它的定位,2G/2B 业务齐头并进,一边扎根政府项目,助力数字政务升级;一边帮企业智能客服、智能办公,全方位提升效率,让自己的生态更完整,发展更稳健。

2、MiniMax:音频、视频,一骑绝尘

在多模态赛道尤其是音视频领域,MiniMax 绝对是不容忽视的存在。其自研的语音大模型能够生成媲美真人的、富有情感的语音,在社交、游戏、教育等场景有巨大潜力。在视频生成上也同样出色,输入文字脚本,几秒钟就能渲染出特效炫酷、剧情紧凑的短视频,极大降低成本。MiniMax 推出的 AI 社交应用 " 星野 "、AI 助手 " 海螺 AI" 等产品,也展现了其将技术快速产品化的能力。

此外,创始人闫俊杰曾是商汤科技副总裁,对技术和商业都有着极为深刻理解。在当前短视频、直播带货火爆全网,对音频特效、视频内容自动化生产需求井喷的市场环境下,带领 MiniMax 和各大短视频平台、音频内容创作社区深度合作,为创作者持续输送 " 弹药 ",在垂直赛道越跑越快,一骑绝尘。

3、月之暗面:长文本、数学能力强

月之暗面专注长文本处理与数学推理,这堪称知识密集型场景的硬核需求。比如,在学术研究领域,长篇文献综述撰写,它能梳理海量文献脉络,精准提炼关键观点;在金融风控领域,又能靠它分析长篇财务报告、挖掘隐藏风险点,给出量化评估建议。

Kimi 在数学推理等领域也展现出不俗的实力,其推出的 k0-math 数学推理模型在多个基准测试中表现优异,并在中考、高考、考研及 MATH 等基础数学测试中的表现超越了 OpenAI 的 o1-mini 和 o1-preview 模型。

4、阶跃星辰:多模态领域表现突出

阶跃星辰成立短短两年,就推出 22 款自研基座模型,其中 16 款多模态模型,占比超 7 成,被称为 " 多模态卷王 "。它坚持理解生成一体化路线,这种技术远见,完美契合当下 AI 从多模态融合迈向一体化的大趋势。阶跃的多模态模型不仅在国内外权威榜单上频频夺冠,更是和产业界展开了深度融合,比如和 OPPO 手机合作 " 一键问屏 " 功能,用户长按手机界面,就能智能检索屏幕内容相关信息;和智元机器人携手,为具身机器人装上 " 智慧眼睛 ",精准识别环境、灵活规划行动路径。

此外,阶跃星辰的商业化之路也走得非常扎实,比如茶百道接入它家 Step-1V 多模态理解大模型,实现智能巡检、AIGC 营销,门店运营效率大幅提升,也让阶跃星辰收获了更多的付费用户。

04

最终比拼的是商业化能力

从当年的 " 百模大战 ",到后来的 "AI 六小虎 ",再到如今的 " 新基模五强 ",为什么短短两三年的时间,就有那么多红极一时的 AI 企业,或出局或 " 泯然众人矣 "?一个极为重要原因就是:有些企业只懂烧钱做技术,不懂赚钱做商业。

如上文提到的,大模型是资本密集型、人才密集型、数据密集型行业。但仅仅有钱、有人、有数据,就能成功吗?未必。商业的本质是创造价值并获取价值。技术再先进,如果不能转化为用户愿意买单的产品或服务,不能形成可持续的商业模式,最终也只是昙花一现。这就像 " 必要条件 " 和 " 充分条件 " 的关系,钱、人、数据是必要条件,但成功的商业化才是充分条件。

所以我们会看到,无论是 OpenAI 与微软的深度绑定,通过 Azure 云服务和 Copilot 系列产品变现;还是国内的阿里、百度、字节,依托自身的云服务和丰富应用场景推动大模型落地,都体现了 " 技术 + 场景 + 商业 " 的闭环逻辑。而这也恰恰暗合了商业达尔文主义:能活下来的一定是踩中时代节奏、满足市场刚需、又能实现商业模式自洽的企业,而不会是技术浪漫主义者,或 AI 理想主义者。

最后,中国或许真的不需要几十上百家公司,都去卷基础大模型。这既不经济,也不高效。少数几家巨头在基础模型层面持续投入,提供稳定、强大、且成本可控的 "AI 底座 " 就足够了。更多的创新和机会,应该在于应用层,在于如何利用大模型,结合行业 Know-how,解决实际问题,创造真正的商业价值。

文章仅代表作者本人观点

  —— · END · ——  

按俺是大标题哦,亲亲

隶属于华夏基石咨询集团

※ 咨询服务领域   ※

战略丨营销丨研发丨生产丨运营丨

企业文化丨组织人力丨 AI 应用

中国领先的实战型、陪伴型咨询服务机构

地址:北京中钢国际大厦 A 座

投稿、转载及开白等:87824329@qq.com

咨询合作:13801295388(微信同号)

衷心感谢读者朋友们的阅读和订阅《管理智慧》,为了便于您及时收到我们的最新推送,敬请星标本公众号,及时分享有价值的原创文章,共同推动中国企业管理的高质量发展。