从成立 ATH，到模型三连发，阿里想要的是「握指成拳」

您当前的位置: 首页 > 首页 > 新闻中心

发布时间：2026-04-07 17:00:41

从成立 ATH，到模型三连发，阿里想要的是「握指成拳」(图1)

不遗余力的发展智能，是为了增加生产力。

作者｜张鹏

编辑｜Cynthia

清明节期间，朋友圈一度被 Qwen3.6-Plus 登顶 OpenRouter 的日榜榜首，刷新平台记录这件事刷屏。

如果再把 Qwen3.6-Plus 刷榜和前后的几件事结合在一起看，就有意思了。

3 月 16 日，Alibaba Token Hub（ATH）事业群成立，接下来半个月时间，阿里就像是打了鸡血一样：

3 月 30 日，Qwen3.5-Omni 发布，一口气拿下 215 个 SOTA；

4 月 1 日，Wan2.7-Image 发布，成为国产图像生成模型里最接近 Nano Banana Pro 的存在；

4 月 2 日，Qwen3.6-Plus 登场，仅仅一天后，就以单日调用量 1.4 万亿 Token 刷新 OpenRouter 的官方记录。就在今天，这款模型也毫无悬念拿下了 OpenRouter 的周榜冠军。一个背景知识是，OpenRouter 的美国用户占比高达 47.17%，中国开发者仅占 6.01%。换句话说，这不是一个墙内自嗨的故事，是全球开发者用脚投票给出的结果。

节奏一下子像是回到了 2023 年百模大战的时候，但这一次，卷的难度和目标，都不太一样了。

面对现实，无法松懈

DeepSeek 和 Qwen 先后登顶全球开源模型顶峰之后，国内 AI 圈曾有过一种乐观情绪：中国模型和海外的差距，已经大幅缩小了。

但这太乐观了。

拿大洋彼岸的 Anthropic 作参照物。这家公司 2025 年初估值才 600 亿美元，一年后就涨到 3800 亿，六倍增长。年化收入，从 2025 年的 10 亿美元，增长到 2026 年 3 月 190 亿美元，涨了 19 倍。

具体到模型上：2025 年 2 月发布 3.7 Sonnet 与 Claude Code，只到 2026 年 3 月发布 Opus 4.6 和 Sonnet 4.6，中间每个季度的模型全部都是当时的 SOTA 模型，并且从 MCP 到 skills，从编程到 agent，Anthropic 也在不断刷新 AI 场景想象力的天花板。

更值得注意的，当 Claude 系列模型的编程智能能力到达临界点之后，还看到带来 Claude Code、Claude Cowork 在内产品能力和市场规模的加速，从而形成一个不断加速、左脚踩右脚自我强化的飞轮。

类比一下，就是领先者的火箭已经突破大气层，其加速度在飙升；而如果追赶者还在大气层爬升，每一步都要对抗摩擦力，双方差距，很容易越拉越大。

AI 的马拉松，只能面对现实，无法松懈。Qwen 和 DeepSeek 此前的崛起给了我们信心，但国产模型面临的压力并未减少，之前我和 Kimi、Minimax 这样的创业团队交流，能明显感觉到他们提着这口气在追赶。现在看来，阿里现在这口气没有松。

回头看看，阿里确实站在有利的位置上，不止千问（Qwen）与万相（Wan）两大基模系列性能均处于世界顶尖水平。最近我的「龙虾研究员」也提示观察到亚马逊、Airbnb 等公司也基于 Qwen 发展新业务；技术研发层面，英伟达、微软、Meta 等知名科技巨头基于 Qwen 开发衍生模型；前沿研究层面，斯坦福李飞飞团队、硅谷独角兽 Thinking Machines Lab、艾伦 AI 研究所等顶尖机构基于 Qwen 推进前沿技术创新。可以说开发者口碑上，阿里系的模型不仅赢得了开源声誉，在 OpenRouter 这种全球开发者用脚投票的平台上，也能与全球顶尖模型抗衡。

而前不久成立 ATH 这件事，我觉得是阿里要进一步握手成拳，体现战略决心的动作。

智能的结果必须是生产力

为什么互联网时代的云公司都是有 AB 面业务的公司？比如无论是，亚马逊 AWS、阿里云都是本身有非常成功的 A 面 toC 业务，然后建立了 B 面的云业务。

很重要的一点是你的技术是要服务真实场景的生产力，甚至它本身就是从自己真实业务的需求长出来，然后才变成对外的服务的。这样不仅仅合理，也能效率成本最优。

一个好的模型公司，看起来必须同时是一个好的业务公司，比如今天的 Anthropic。因为所有智能竞赛，最终都要回答一个问题，谁能把智能转化为真实价值？因为智能的最终体现一定是变成生产力。

Token 消耗量背后是已经被市场验证、正在创造价值的业务。这些业务会反哺模型：告诉它什么能力真正有用，什么方向值得投入。

前几年，中文互联网一个很热的话题是要摸着日本过河，因为日本的发展是个很有意思的现象。在「失去的三十年」之前，借助科技创新的力量，日本能在半导体、手机、电脑、家电、汽车、精细化工、钢铁，打得满场开花；广场协定之后，日本骤然失去了面向世界市场的成本优势，所以我们看到日本的诺贝尔奖没有变少，精细化工、半导体材料这些底层、技术路线相对稳定的行业的创新也没断，但是在手机、电视、电动车这些不断变化的 to C 场景中，却突然变得像没头苍蝇一样，陷入加拉帕格斯陷阱，频繁点错科技树：把功能机、显像管电视、氢能汽车做到登峰造极之后，一睁开眼，全世界的主流市场已经是智能机、液晶电视、电动车的天下。

没有真实需求的拉动，技术进步就是无根之萍。所以在亚马逊，贝索斯从第一天就用技术支撑自己的电商主业，而当这个业务足够大、场景足够复杂，云服务就长出来了。在阿里，则是淘宝的洪峰流量倒逼出飞天操作系统，电商的海量支付需求成就了支付宝。

理解了这个逻辑，就看懂阿里为什么要在 2026 年 3 月 16 日成立 Alibaba Token Hub（ATH）。

对阿里来说，组织变革的真正目标，是押注 Agent 时代的 Token 工业化。

过去，AI 的消耗逻辑是线性的：人类提问，AI 回答，一问一答。未来，在 agent 时代，AI 的 token 消耗逻辑是指数的：人提需求，Agent 自动化运行，一个需求能触发几十上百次 Token 消耗。这时候，谁能让 Token 更高效地创造、输送、应用，谁就能在 Agent 时代占据核心位置。

为此，在 ATH 这个全新的组织，阿里不仅由 CEO 吴泳铭亲自下场带队，还对全集团所有与大模型和 AI 应用相关的核心资产，做了分三大板块的流程化梳理:

创造 Token——通义实验室，Qwen 的诞生地，基座能力输出源；

输送 Token——百炼 MaaS 平台，帮助各行各业快速搭建 AI 应用，把 Token 以多种产品形态输送到企业用户手中；

应用 Token——千问 APP、悟空（钉钉旗下的企业级 Agent）、各种垂直场景的 AI 创新应用，覆盖不同用户、不同场景。

在外界看来，这只是一次业务整合。但在阿里内部，调整的背后，是思维惯性的大转向：

电商时代阿里习惯于围绕产品和流量来构建组织，这是过去二十年互联网竞争留下的管理惯性。每条业务线拥有独立的预算与 KPI，围绕各自的 DAU 或 GMV 各自为战。

因此，我们可以看到此前阿里的整体 AI 科技布局事以「通云哥」体系为主，从技术研发角度出发，确实实现了多点开花，但从技术到应用和商业化之间的部门墙则成为掣肘、资源分配问题也因为组织架构的分散而长期存在。

到了 AI 时代，生产要素从人头变成 Token，组织的基本单位也就需要据此做出灵活切换。毕竟，如果我们认同Token 是新世界的石油，那 ATH 应该承担的，就是创造集炼油厂、输油管网、汽车工业于一体的完整工业体系。

不难想见，接下来的 ATH 部门大概率能从整个阿里集团层面，推动资源的更优调配以及不同环节之间的深度配合。前不久，ATH 旗下悟空，在 Qwen3.6-Plus 发布的当天就完成了接入，就是个很好的例子。Qwen3.5-Omni 支持用户对着草图口述需求，模型直接生成带复杂 UI 的产品原型，这种音视频 Vibe Coding 能力的洞察，也同样离不开场景的牵引。

模型在进步，组织在变阵，阿里继续在「折腾」。折腾就对了。

AI 竞赛的每一个里程碑都是新的起点。今天阿里在几天内连续发布三个 sota 模型，不出三个月，OpenAI、Anthropic 们也会发布性能更胜一筹的新版本模型。不同玩家轮流坐庄刷榜，这会是未来相当长一段时间里模型竞争的常态。

所以阿里确实需要继续提住这口气。回顾 PC 时代到移动互联网时代的跨越，那时候，阿里能在电商领域筑起护城河，不是因为它比 eBay 更有钱，也不是因为它比亚马逊更聪明，而是因为它做到真正的战略聚焦，执行坚决，然后以更快节奏、更极致的服务好中国商家。

今天，从 ATH 的成立到三连发的密集发布，至少展现的是同样的战略意志。

*头图来源：阿里

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

极客一问

你如何看待阿里在 AI 上的战略？

从成立 ATH，到模型三连发，阿里想要的是「握指成拳」(图2)

从成立 ATH，到模型三连发，阿里想要的是「握指成拳」(图3)

变量名不存在 {/eyou:field}

上一篇 : 危机公关“沉默疗法”，2026年彻底失效

下一篇 : 白犀牛联手货拉拉启动无人货运规模化商用运营

从成立 ATH，到模型三连发，阿里想要的是「握指成拳」

相关推荐