250926--大摩闭门会-聚...
发布者:Vito的行研札记
·大会关注度提升背景:云栖大会每年均举办,但2025年关注度显著提高,主要因AI及阿里云发展速度超预期。大会主要面向产业链从业者,而非单纯资方。 ·核心积极信号:本次大会释放三大积极信号:其一,需求端呈现明确增长趋势,token用量每两三个月翻倍;其二,供给端展望乐观,预计2032年全球数据中心用量将实现10倍增量;其三,管理层战略决策明确,将加大AI相关投入。综合来看,阿里云在需求端与供给端均呈现显著增长态势,管理层对云业务未来展望极为正面,增速及AI投入增量预计将加快。 ·云业务增速与CAPEX预期:当前对云业务增速的预测为2025年及2026年均约30%。关于CAPEX,目前三年指引为3800亿,但基于大会释放的积极趋势,该指引存在上调空间。此外,由于大会传递的正面信息,2025年及2026年的云业务增速均有上修潜力。 ·产品发布与模型进展:大会发布了最新的Queen Max模型,该模型为千问家族中最大、token量最大的模型。市场地位方面,其在全球开源模型中位列数一数二,国内份额最大,与OpenAI、Anthropic并列全球前三。
·阿里云产能规划拆解:阿里对云业务的展望中提到重要一点是产能“十年十倍”规划,其基数采用2022年底Generative AI时代到来前的水平。2022年底,阿里的产能存在不同口径数据:下单口径约为2.25GW,而实际使用的产能(Utilize capacity)则在1-1.5GW区间。若按十年十倍计算,到2032年对应的产能目标约为13-15GW,相应的年需求为1-2GW。该规划被认为较为保守,对应的年基本开支(CAPEX)预计在1500-2000亿区间,且这一水平不会超出可承担范围。 ·产业链受益标的推荐:从供应商角度看,Topic和GDS是阿里份额最大的供应商,无论是存量还是增量业务均占优。世纪互联作为阿里重要供应商,在乌兰察布的布局优势显著。 ·A股数据中心标的评价:对于A股数据中心标的,数据港95%以上业务来自阿里,但该公司已砍掉IBC开发能力,无力参与大厂新单竞争(行业称“退出牌桌”)。其余A股公司在增长能力和估值上均无竞争力,若需挑选,奥飞数据为相对较好的选择。 ·未上市受益公司提示:在阿里、字节的大招标中,部分未上市的公司表现突出,如处于pre A阶段的中联数据、中金数据,其增长良好,受益逻辑与世纪互联类似,产业研究可重点关注。
·AI对软件预算的影响:市场有‘AI吃掉软件’论断,短期来看,AI虽未必完全取代软件,但会抢占软件预算,给企业级软件增长带来痛点。简单AI Talk应用(如大模型套壳场景)或被AI模型替代,变现面临挑战。 ·AI应用场景观察:展会中,软件层面Agent应用火热,但数量多且难实现差异化,需深入研究能否有突围者。AI办公类初创企业或产品竞争激烈,对金山办公产品不利。此外,AI玩具、AI眼镜等硬件类公司参展,是较热的AI应用场景。
·GPU采购成本与产能缺口:AI GPU采购成本方面,Oracle在美国进行4.5G加瓦斯基建投资时,每Giga Watt的AI GPU芯片采购需花费约200亿美元(折合1400亿人民币)。若未来每年扩充一个Giga Watts,所需的DPA量和资金规模显著。国内Foundry产能方面,中芯国际(SMIC)7纳米节点当前月产能约1 2万片,其中半数需分配给华为手机芯片生产。产能缺口方面,2025年所有国产芯片总产能约80亿人民币,而仅阿里一家公司每年采购AI服务的支出即达一两千亿人民币,供需存在显著落差。 ·自研芯片受限情况:阿里平头哥、百度昆仑等自研芯片因美国出口管制受限。自2025年1月起,台积电、三星等代工厂无法为其生产芯片。由于相关调查始于2024年10月,即便当时紧急下单备货,累计库存仍非常有限。中长期看,平头哥、百度昆仑可能迁移至中芯国际等本土代工厂生产,但迁移过程至少需1 2年,因此2025年的芯片缺口仍需依赖进口芯片弥补。 ·国产与海外芯片性能对比:国产芯片与海外主流GPU性能存在差距。昆仑芯、平头哥的性能较海外主流GPU约差3 4倍;华为芯片性能对标NVIDIA H20或更早的A100,多卡连接可通过提升通信效率缩小性能差距。工艺方面,中芯国际工艺下,华为950系列芯片的F16数据类型算力从800TFLOPS降至500TFLOPS(降速约30%)。相同算力下,中芯国际版本的功耗较台积电版本增加约30%。多卡连接虽可提升性能,但需增加通道数量,导致芯片成本和耗电量上升。 ·未来产能展望:中芯国际7纳米节点产能呈增长趋势:2025年初月产1万片,2025年底月产2万片,2026年月产4万片,2027年月产8万片。2025年分配用于生产GPU的7纳米晶圆月均约7000片,全年约8 9万片(良率30%),预计华为可生产约800 900K片,中国总量约100万片(英伟达同期产量约520万片)。国产GPU与ASIC的产能占比方面,GPU占7 8成,主要由华为、海光(主要服务国企及国家机关)、寒武纪供应;ASIC占2成。百度昆仑Next芯片需迁移至中芯国际生产(工艺可能为7纳米或5纳米),但迁移需1年时间,预计2027年方可量产。长期(3 5年)看,国产芯片产能将显著提升,但存在效率较低(功耗大、成本高)的问题。
A: 云栖大会的关键要点包括:需求端增长显著,token用量每两三个月翻倍,后续需求将加速扩大;供给端预测2032年全球数据中心用量将实现10倍增长;基于供给提升,公司决定加大AI相关投入。管理层对云业务未来展望积极,预计增速及AI投入将加快;当前三年CAPEX规划为3800亿元,存在上调空间;云业务今年及明年增速预计均为30%,大会后增速存在上行潜力。 A: Queen Max是千问家族中最大的模型,token量最大;阿里巴巴在模型领域全球排名前三,与OpenAI、Anthropic并列;该模型为全球头部开源模型之一,国内市场份额最大。 A: 阿里云当前估值为5倍PS,存在重估空间;海外同行估值在十出头或十几倍,因需求与供给端显著增长及行业领先地位,阿里云估值存在上调机会;SOTP目标价200元,最大重估驱动因素来自云业务。 A: 国内AI模型变现以云服务为主,主流收费模式为按token用量计费,部分企业定制模型服务采用差异化收费方案。当前阿里云云服务利润率约8-9%,短期内将维持该水平,中长期有望提升至两位数,但与海外订阅制模式下20-30%的利润率仍有较大差距,主要因国内收费标准较低。此外,阿里云海外云业务增速显著,过去四个季度持续加速,本季度实现三位数增长,依托国内成本结构优势,其海外竞争力逐步显现,未来将聚焦海外市场投入。 A: 不同模型的Token收费标准存在差异,但整体收费水平极低,具体约为零点零零几。 A: 当前A2的K-Pax现金储备充足,近期通过海外融资等方式补充资金。阿里云自身现金流无法支撑阿里集团庞大的资本开支,需从集团层面统筹支持,且阿里云承担了集团算力及AI领域的全部投入,并非仅依靠云业务自身现金流维持。 A: 昆仑芯与平头哥性能弱于华为芯片,华为芯片性能对标NVIDIA H20,甚至可能接近早期版本A100。多卡连接可提升性能,AI计算中communication time与decoding time的表现因应用而异,若communication time优化,性能差距可缩小。当前昆仑芯、平头哥与国外主流GPU性能差距约3-4倍。 A: 在F16 DataType下,华为950系列芯片算力从800 TFLOPS降至500 TFLOPS,降幅约30%。 A: 7纳米节点年初产能约1万片,年底预计达2万片,明年可提升至4万片。 A: 今年用于生产GPU的7纳米晶圆月均约7000片,全年约8万至9万片,因良率较低,华为今年GPU产量约80万至90万片,中国整体产量约100万片。英伟达通过Playwell今年生产的GPU约520万片,数量上中国与英伟达的比例约为1:5;性能方面,单芯片性能约为英伟达的1/4,因此国产GPU总算力与英伟达的比例约为1:20。 A: 国产GPU未来主要由华为、海光及寒武纪分配,其中华为与寒武纪预计占比约七八成,海光产品主要面向国企及国家机关用户;此外,国产GPU的软件栈调试是当前应用的主要障碍。国产ASIC预计占比约两成。 A: 百度昆仑芯因三星暂停生产,已转向开发下一代产品昆仑Next,该产品将由中芯国际生产,制程可能为7纳米或5纳米,开发周期至少一年,预计2027年推出国产ASIC。 A: SMIC版本芯片的功耗显著高于台积电版本。由于性能从800T flops降至约500T flops,在相同算力输出情况下,SMIC版本芯片的功耗比台积电版本高约30%-40%。 A: 单卡或单芯片算力不足时,多卡连接若载波间带宽显著提升,性能损失可能较小;但多卡连接通过增加通道实现高速率会导致芯片成本升高及耗电量增加。 A: 国内头部AI公司发展AI不会受半导体供给影响。主要原因是国内可生产的芯片量结合进口来源能够满足需求。 A: 现阶段国产芯片存在应用限制,华为难以使用且ASIC芯片无产能或无法生产。预计2-3年内,Smiggle产能将增长4倍,杨丽产能提升,ASIC芯片实现国内生产;从3-5年维度看,国产芯片供应量将显著增加。但届时主要问题可能集中在效率较低、功耗较大、成本较高,影响中国AI芯片的全球竞争力。从经济角度看,国产AI芯片面临挑战;但从自给自足角度看,2-3年后国产芯片供应能力将显著改善。 A: 百度的昆仑与阿里的平头哥芯片均基于自用需求研发,因此不考虑通用性。在各自内部使用环境下,二者性能差异较小,相较于进口GPU,甚至在部分场景下性能更优。