引爆点?不是一份超预期的财报,也不是一款革命性的新产物。仅仅是一则传闻,对于一款阿里自研、且暂时不会对外销售的AI芯片。 同一时间,大洋彼岸的英伟达,正焦头烂额。他们为中国市场精心打造的"特供"H20芯片,在安全审查、价格博弈和客户的集体沉默中,走向停产。 在老黄,也就是英伟达CEO黄仁勋各种奔走游说之下,好不容易熬到了解禁,却又深陷"后门"阴影,被中国监管机构直接约谈。然后又是价格问题,一笔15%的新增费用,英伟达想让中国客户买单,(说白了,就是涨价),直接提价18%。 平头哥的第一个动作,就足以让当时的市场感到困惑。当所有人都盯着GPGPU这条最光鲜、也最拥挤的赛道时,平头哥团队却把目光投向了别处,他们看到了RISC-V,一个在当时还略显稚嫩的开源架构,没有ARM的授权枷锁,也没有x86的封闭生态。 这在当时被一些人看作是"不务正业"。放弃唾手可得的IP授权费,去做一件吃力不讨好的"布道"工作。但数据的回击是冷酷的:截至目前,玄铁CPU的出货量已超过150亿颗。在无数物联网设备、智能家居和工业模块中,悄悄植入了阿里的技术基因。 在阿里内部,负责"城市大脑"的团队一度很痛苦。要实时处理杭州主城区成千上万路摄像头传回的视频流,需要天文数字的算力,传统的GPU方案,成本高得吓人。含光800芯片,并非诞生于某个高瞻远瞩的战略规划,而是诞生于这种具体而痛苦的业务需求。 专门为阿里的视觉处理场景而生。78563 IPS的推理性能,500 IPS/W的能效比——这些冰冷的数字背后,是业务逻辑的重构。过去需要40颗传统GPU才能完成的工作,现在只需要4颗含光800,同时延迟从300毫秒降至150毫秒。 "自研服务器芯片与阿里云后续发展潜力有莫大关系",张建锋的这句话,几乎挑明了一切。云计算就是一门规模巨大的"算力租赁"生意,最大的成本就是服务器,也就是芯片。 环顾阿里所处的周遭环境,尤其是在服务器芯片领域,英特尔的x86架构是绝对的统治者。根据IDC的数据,x86服务器常年占据整个市场超过90%的收入份额,而英特尔自己,又吃掉了x86市场90%以上的蛋糕,几乎就是铁板一块。 而在AI加速领域,英伟达的CUDA生态则是另一道高墙。它不仅仅是硬件,更是十年时间里积累起来的软件、库和开发者习惯。几乎所有的AI公司,最初都只能在英伟达的土地上盖房子。 在大洋彼岸,亚马逊早就用自研的Graviton芯片,在云服务市场杀出了一条血路,把价格打到了地板上。苹果则用M系列芯片,告诉了全世界什么叫软硬一体的恐怖效率,这些不是什么秘密,是公开的阳谋。 倘若阿里选择GPGPU这条路线,那将意味着陷入与英伟达、AMD的市场肉搏战,意味着要从零开始构建一个足以对抗CUDA的软件生态,这几乎是不可能完成的任务。更重要的是,依然会将自己暴露在美国的供应链炮火之下。 自研的倚天和含光芯片,大幅降低了阿里云的算力成本。倚天710,这颗基于最新ARMv9架构、拥有128核CPU、集成了600亿晶体管的5nm芯片,在SPECint2017基准测试中得分达到440,超出业界标杆20%,而能效比更是优越50%以上。反映到云服务上,就是算力性价比提升超过30%,单位算力功耗降低60%。 高性价比的AI算力服务,吸引了海量的AI开发者和公司客户。全球公司软件巨头SAP,选择阿里云作为其全球云计算合作伙伴,支持客户在阿里云上运行和管理其核心软件系统。这是一个强烈的信号。 客户的广泛应用,又像最高级的燃料,反哺着阿里的技术迭代。从升级版的Qwen3,到开源的多视频生成模型和文生图模型,阿里的AI模型库在快速进化。这些模型,又进一步增强了阿里云对客户的吸引力。 机器后方播撒下的玄铁生态种子,也开始发芽。蚂蚁链发布的首款自研区块链安全芯片,其核心就搭载了平头哥的玄鐵高性能处理器。 腾讯的打法更像个聪明的基金经理,在牌桌上四处下注——燧原、摩尔线程… …它不会输掉整个游戏,但也永远无法All in。这种模式分散了风险,但也使其难以形成软硬一体的深度协同效应。 被时势推到了第一线,用昇腾硬撼CUDA的百年帝国。根据IDC的数据,2024年中国GPU市场,华为昇腾已经抢下了23%的份额。这是一场值得尊敬的血战。 在最近的财报电话会上,吴泳铭重申了那个数字:3800亿。未来三年的投入。他还说,面对风险,已经准备了"后备方案",有"不同的合作伙伴"。


