没进前五的DeepSeek，才是老外们最「恐惧」的存在

这几天， DeepSeek 将在春节前推出新一代旗舰 AI 模型的消息，刷屏了。

其实这事儿爆料非常早，开年就有风声， 1 月 9 日英国“路透社”还专门做了报道。

为啥最近才发酵？主要 DeepSeek 最新发布的 FlashMLA 代码里，出现了新模型的架构，相当于官方实锤。

这个时间点挺微妙的。

记得去年，也是 1 月 20 日， DeepSeek 带着 R1 横空出世，那时候为了能顺畅用上它，不知有多少人翻遍了自部署教程，还有人上淘宝花钱买所谓的“满血版”应用。

几乎是瞬间， DeepSeek 就屠榜了各类应用下载榜单，而且是长时间霸榜，无人可望其项背。

那时候，文心一言和豆包打得正欢，大有两分天下之势，而 DeepSeek 的出现，则直接杀死了比赛。甚至，元宝仅靠着接入 DeepSeek 的操作，就硬生生地挤上了国内 AI 竞争的牌桌。

有人给这场颠覆起了一个名字叫：

DeepSeek 时刻。

一年后的今天，在一部分人的眼里， DeepSeek 似乎已经掉队了。

它不追热点，不搞宣发，虽然有几次更新，但皆不如 R1 震撼，在一众恨不得把全能、多模态、 AI 搜索写在脸上的竞品里， DeepSeek 显得有些格格不入。

如今的 App Store 的排行榜，免费应用下载榜的前三名，已经被豆包、千问、元宝牢牢占据，而 DeepSeek 排在：

第七。

但这正是最有意思的地方。

即便在今天，国外一众 AI 巨头聊起中国 AI 的竞争力时，提到最多的名字，依旧是 DeepSeek 。

开年，微软发布了《 2025 全球 AI 普及报告》，将 DeepSeek 的崛起列为 2025 年“最意想不到的发展之一”。

目前， DeepSeek 相关的模型调用，仍是多数平台的首选。

在国外，出现了反向 “套壳”，许多美国 AI 初创公司，已经默认使用 DeepSeek 模型作为基座，比如 Cogito v2.1 ，其实就是 V3 的微调版。

欧洲科技界甚至还掀起了 “打造欧洲版 DeepSeek ”的竞赛。

问题来了，为什么？

因为 DeepSeek 直接掀了桌子。

在硅谷的逻辑里，要做出顶级模型，得烧掉一个中等国家的 GDP 。马斯克的 xAI 前几天刚刚融了 200 亿美元，用来维系昂贵的算力竞赛。

但在 DeepSeek 这里，逻辑完全变了。

根据技术社区和公开报告的测算， DeepSeek-V3 的研发与训练成本仅在 600 万美元左右。对比之下，像 Llama 3 或 GPT-4 这类同量级的美国模型，其训练开销保守估计都在十倍以上。

相当于用撺摩托车的钱，造了辆顶级超跑。

珠玉在前，这让过去那些拿着 PPT ，去华尔街动辄融资数亿美金的 AI 大厂们，怎么办？

这种逻辑的崩塌是致命的。

同时，这种成本结构上的代差，直接导致了 API 端的价格血战，当美国顶级模型的百万 Token 定价还在几美金徘徊时， DeepSeek 直接给出了 0.1 到 0.2 美元的“地价”。

在老外眼里， DeepSeek 就是 AI 版的拼多多，关键这个拼多多，还能给出京东的品质。

低价兼具高效。

数据显示，在所有发布不满一年的新模型中，中国模型的总下载量已经超越了美国。

在那些被西方巨头忽略的全球南方市场，开发者正成群结队投向 DeepSeek 的怀抱。

数据显示，在非洲，其使用率是其他地区的 2 到 4 倍；在白俄罗斯和古巴，其市场份额分别高达 56% 和 49%

在被西方忽略的角落， DeepSeek 几乎成了唯一选择。微软总裁布拉德·史密斯直言：

在非西方国家，中国 DeepSeek 已经赢了。

这是农村包围城市的胜利。

这种渗透，也为中国 AI 争取到了最宝贵的发展时间。

关键，还在于 DeepSeek 的“沉默”。

平时一声不吭，没事就甩出两篇顶级学术论文，不玩骚操作，基本功扎实，还有创新能力，老外最怕这种。

什么下载榜单排名，人家根本不 care ，就是埋头搞技术。

为啥，不缺票子。

在这个所有人都急着向投资人交作业、急着变现的时代， DeepSeek 至今保持着零外部融资的纪录，它的母公司幻方量化，大 A 的股东朋友们都熟。

2025 年幻方量化的收入超过 7 亿美元，也就是约 50 亿元人民币。

创始人梁文锋直接用这笔钱供养 AI 梦。

前段时间， DeepSeek 又开始悄悄发论文了，还把之前的 R1 论文更新了，一年里所有的训练细节、失败尝试，甚至那些不为人知的坑，全部补齐。

两篇新论文，一篇讲最新的模型训练方法，另一篇，探究如何用便宜内存，取代昂贵的 HBM。

这一次，它想颠覆现在大模型训练的底层基石。

这才是 DeepSeek 的底色，在所有人都在卷资源的时候，它在卷效率；在所有人都在追逐商业化的时候，它在追逐技术极限。

当然， DeepSeek 的模式可能很难复制，毕竟既是创始人团队、技术团队，又是金主爸爸的情况太少了，但这种愿意沉淀下来的心态，一定是未来 AI 发展需要的。

大家都在讨论，中国 AI 的下个“ DeepSeek 时刻”会出现在谁的身上？

也许，还是 DeepSeek 。