从成立 ATH,到模型三连发,阿里想要的是「握指成拳」

您当前的位置:   首页 > 首页 > 新闻中心
从成立 ATH,到模型三连发,阿里想要的是「握指成拳」
发布时间:2026-04-07 17:00:41


不遗余力的发展智能,是为了增加生产力。


作者|张鹏

编辑|Cynthia

清明节期间,朋友圈一度被 Qwen3.6-Plus 登顶 OpenRouter 的日榜榜首,刷新平台记录这件事刷屏。

如果再把 Qwen3.6-Plus 刷榜和前后的几件事结合在一起看,就有意思了。

3 月 16 日,Alibaba Token Hub(ATH)事业群成立,接下来半个月时间,阿里就像是打了鸡血一样:

3 月 30 日,Qwen3.5-Omni 发布,一口气拿下 215 个 SOTA;

4 月 1 日,Wan2.7-Image 发布,成为国产图像生成模型里最接近 Nano Banana Pro 的存在;

4 月 2 日,Qwen3.6-Plus 登场,仅仅一天后,就以单日调用量 1.4 万亿 Token 刷新 OpenRouter 的官方记录。就在今天,这款模型也毫无悬念拿下了 OpenRouter 的周榜冠军。一个背景知识是,OpenRouter 的美国用户占比高达 47.17%,中国开发者仅占 6.01%。换句话说,这不是一个墙内自嗨的故事,是全球开发者用脚投票给出的结果。


节奏一下子像是回到了 2023 年百模大战的时候,但这一次,卷的难度和目标,都不太一样了。

01

面对现实,无法松懈

DeepSeek 和 Qwen 先后登顶全球开源模型顶峰之后,国内 AI 圈曾有过一种乐观情绪:中国模型和海外的差距,已经大幅缩小了。

但这太乐观了。

拿大洋彼岸的 Anthropic 作参照物。这家公司 2025 年初估值才 600 亿美元,一年后就涨到 3800 亿,六倍增长。年化收入,从 2025 年的 10 亿美元,增长到 2026 年 3 月 190 亿美元,涨了 19 倍。

具体到模型上:2025 年 2 月发布 3.7 Sonnet 与 Claude Code,只到 2026 年 3 月发布 Opus 4.6 和 Sonnet 4.6,中间每个季度的模型全部都是当时的 SOTA 模型,并且从 MCP 到 skills,从编程到 agent,Anthropic 也在不断刷新 AI 场景想象力的天花板。

更值得注意的,当 Claude 系列模型的编程智能能力到达临界点之后,还看到带来 Claude Code、Claude Cowork 在内产品能力和市场规模的加速,从而形成一个不断加速、左脚踩右脚自我强化的飞轮

类比一下,就是领先者的火箭已经突破大气层,其加速度在飙升;而如果追赶者还在大气层爬升,每一步都要对抗摩擦力,双方差距,很容易越拉越大。

AI 的马拉松,只能面对现实,无法松懈。Qwen 和 DeepSeek 此前的崛起给了我们信心,但国产模型面临的压力并未减少,之前我和 Kimi、Minimax 这样的创业团队交流,能明显感觉到他们提着这口气在追赶。现在看来,阿里现在这口气没有松。

回头看看,阿里确实站在有利的位置上,不止千问(Qwen)与万相(Wan)两大基模系列性能均处于世界顶尖水平。最近我的「龙虾研究员」也提示观察到亚马逊、Airbnb 等公司也基于 Qwen 发展新业务;技术研发层面,英伟达、微软、Meta 等知名科技巨头基于 Qwen 开发衍生模型;前沿研究层面,斯坦福李飞飞团队、硅谷独角兽 Thinking Machines Lab、艾伦 AI 研究所等顶尖机构基于 Qwen 推进前沿技术创新。可以说开发者口碑上,阿里系的模型不仅赢得了开源声誉,在 OpenRouter 这种全球开发者用脚投票的平台上,也能与全球顶尖模型抗衡。

而前不久成立 ATH 这件事,我觉得是阿里要进一步握手成拳,体现战略决心的动作。

02

智能的结果必须是生产力

为什么互联网时代的云公司都是有 AB 面业务的公司?比如无论是,亚马逊 AWS、阿里云都是本身有非常成功的 A 面 toC 业务,然后建立了 B 面的云业务。

很重要的一点是你的技术是要服务真实场景的生产力,甚至它本身就是从自己真实业务的需求长出来,然后才变成对外的服务的。这样不仅仅合理,也能效率成本最优。

一个好的模型公司,看起来必须同时是一个好的业务公司,比如今天的 Anthropic。因为所有智能竞赛,最终都要回答一个问题,谁能把智能转化为真实价值?因为智能的最终体现一定是变成生产力。

Token 消耗量背后是已经被市场验证、正在创造价值的业务。这些业务会反哺模型:告诉它什么能力真正有用,什么方向值得投入

前几年,中文互联网一个很热的话题是要摸着日本过河,因为日本的发展是个很有意思的现象。在「失去的三十年」之前,借助科技创新的力量,日本能在半导体、手机、电脑、家电、汽车、精细化工、钢铁,打得满场开花;广场协定之后,日本骤然失去了面向世界市场的成本优势,所以我们看到日本的诺贝尔奖没有变少,精细化工、半导体材料这些底层、技术路线相对稳定的行业的创新也没断,但是在手机、电视、电动车这些不断变化的 to C 场景中,却突然变得像没头苍蝇一样,陷入加拉帕格斯陷阱,频繁点错科技树:把功能机、显像管电视、氢能汽车做到登峰造极之后,一睁开眼,全世界的主流市场已经是智能机、液晶电视、电动车的天下。

没有真实需求的拉动,技术进步就是无根之萍。所以在亚马逊,贝索斯从第一天就用技术支撑自己的电商主业,而当这个业务足够大、场景足够复杂,云服务就长出来了。在阿里,则是淘宝的洪峰流量倒逼出飞天操作系统,电商的海量支付需求成就了支付宝。

理解了这个逻辑,就看懂阿里为什么要在 2026 年 3 月 16 日成立 Alibaba Token Hub(ATH)。

对阿里来说,组织变革的真正目标,是押注 Agent 时代的 Token 工业化。

过去,AI 的消耗逻辑是线性的:人类提问,AI 回答,一问一答。未来,在 agent 时代,AI 的 token 消耗逻辑是指数的:人提需求,Agent 自动化运行,一个需求能触发几十上百次 Token 消耗。这时候,谁能让 Token 更高效地创造、输送、应用,谁就能在 Agent 时代占据核心位置。

为此,在 ATH 这个全新的组织,阿里不仅由 CEO 吴泳铭亲自下场带队,还对全集团所有与大模型和 AI 应用相关的核心资产,做了分三大板块的流程化梳理:

创造 Token——通义实验室,Qwen 的诞生地,基座能力输出源;

输送 Token——百炼 MaaS 平台,帮助各行各业快速搭建 AI 应用,把 Token 以多种产品形态输送到企业用户手中;

应用 Token——千问 APP、悟空(钉钉旗下的企业级 Agent)、各种垂直场景的 AI 创新应用,覆盖不同用户、不同场景。

在外界看来,这只是一次业务整合。但在阿里内部,调整的背后,是思维惯性的大转向:

电商时代阿里习惯于围绕产品和流量来构建组织,这是过去二十年互联网竞争留下的管理惯性。每条业务线拥有独立的预算与 KPI,围绕各自的 DAU 或 GMV 各自为战。

因此,我们可以看到此前阿里的整体 AI 科技布局事以「通云哥」体系为主,从技术研发角度出发,确实实现了多点开花,但从技术到应用和商业化之间的部门墙则成为掣肘、资源分配问题也因为组织架构的分散而长期存在。

到了 AI 时代,生产要素从人头变成 Token,组织的基本单位也就需要据此做出灵活切换。毕竟,如果我们认同Token 是新世界的石油,那 ATH 应该承担的,就是创造集炼油厂、输油管网、汽车工业于一体的完整工业体系。

不难想见,接下来的 ATH 部门大概率能从整个阿里集团层面,推动资源的更优调配以及不同环节之间的深度配合。前不久,ATH 旗下悟空,在 Qwen3.6-Plus 发布的当天就完成了接入,就是个很好的例子。Qwen3.5-Omni 支持用户对着草图口述需求,模型直接生成带复杂 UI 的产品原型,这种音视频 Vibe Coding 能力的洞察,也同样离不开场景的牵引。

模型在进步,组织在变阵,阿里继续在「折腾」。折腾就对了。

AI 竞赛的每一个里程碑都是新的起点。今天阿里在几天内连续发布三个 sota 模型,不出三个月,OpenAI、Anthropic 们也会发布性能更胜一筹的新版本模型。不同玩家轮流坐庄刷榜,这会是未来相当长一段时间里模型竞争的常态。

所以阿里确实需要继续提住这口气。回顾 PC 时代到移动互联网时代的跨越,那时候,阿里能在电商领域筑起护城河,不是因为它比 eBay 更有钱,也不是因为它比亚马逊更聪明,而是因为它做到真正的战略聚焦,执行坚决,然后以更快节奏、更极致的服务好中国商家。

今天,从 ATH 的成立到三连发的密集发布,至少展现的是同样的战略意志。

*头图来源:阿里

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问

你如何看待阿里在 AI 上的战略?

变量名不存在 {/eyou:field}