半导体+光电更新 ①受CPU...
发布者:乐晴
①受CPU供应紧张的报道,英特尔和AMD隔夜均涨超7%;Arm大涨16.38%,公布自研AGI CPU并给出超预期营收增长展望。
②美股存储板块全线下跌,美光科技迎来日线5连跌,闪迪、西部数据和希捷下跌。受日前谷歌发布能“显著压缩KV缓存”的技术Google TurboQuant影响,或引发存储下跌。
③闪迪公司:根据SEC文件披露,闪迪旗下部门将以10亿美元收购南亚科技1.39亿股股份,占股比例为3.9%。
④今日沐曦股份等股将披露2025年报。
⑤受原材料价格持续上涨等因素影响,LED全产业链密集调价。
1)据报道,英特尔和AMD告知客户上调3月和4月CPU价格。CPU涨价趋势持续,主要系产能受限以及AI Agent等AI发展引起的CPU需求持续上调。
2)Agent时代来临,基础设施建设重心有望转向“CPU强调度”,CPU的量和性能的需求持续超预期。
随着“龙虾人”等AI Agent的普及,AI负载范式正从静态推理转向动态调度。由于Agent涉及高频的工具调用、沙盒隔离及多步规划,这些任务对CPU的单核性能、内存带宽及虚拟化效率产生了刚性需求。AI算力的瓶颈正在向CPU端偏移,未来CPU的核数与性能需求有望迎来爆发式增长。
3)国产CPU有望量价齐升,X86、ARM架构国产CPU有望持续主导
当前中国 CPU 市场处于算力需求爆发与国产替代共振的拐点,Intel、AMD CPU 因供需错配而涨价缺货。国产高端CPU有望量价齐升,开启替代红利与自主红利双重奏。目前国产服务器CPU市场已形成“多路并行”格局,其中 ARM 与 X86 架构占据主导地位。海光信息作为国产X86高端服务器CPU龙头,禾盛新材增资的熠知电子作为国内稀缺的商业化ARM V9架构服务器CPU先锋,皆有望持续受益。
我们看好AI Agent爆发下来带的CPU需求提升以及国产CPU的长期发展趋势,相关:海光信息、禾盛新材等。
闪迪:约10亿美元收购南亚科约1.39亿股普通股,占交易完成后的3.9%,交易价格平均折价15%,与股权交易同步的是闪迪和南亚科达成多年期战略合作供应协议,南亚科将向闪迪持续供应DRAM产品,支持其长期DRAM采购策略。
铠侠:全资子公司参与南亚科定向增发,并与其签订DRAM长期供应先可以,铠侠认购南亚科7000万股约5亿美元普通股。旨在强化SSD业务所需DRAM组件的中长期稳定供应。
为什么SSD公司需要DRAM?通常SSD有主控芯片+NAND组成,但是在不同种类的SSD中,处理内存的方式各不相同,高性能SSD中缓冲内存是一个独立的DRAM芯片,以提高速率和性能;低端SSD中缓冲内存可能会集成到主控芯片中,或者不内置任何缓冲内存,而是使用host memory的一部分。
闪迪和铠侠参股南亚科,以期保障DRAM供应,我们认为是其对高端市场的长期需求前景的乐观展望表现,无需过多忧虑,是在超级周期下,高增长AI市场保障供应的灵活手段之一。近期国内佰维等公司披露15亿美元2年期晶圆保障协议,亦是产业针对未来市场乐观的体现,在没有出现明显的恶化信号之前,仍建议对产业链保持积极态度。
鄢凡/谌薇/王焱仟
Google TurboQuant 专为大模型推理(LLM Inference)中的内存瓶颈与效率难题而打造。
作为一种创新的新型压缩算法,它实现了 LLM 键值(KV)缓存内存至少 6 倍的显著减少,并带来高达 8 倍的端到端推理速度提升。在极致压缩的同时,该技术突破性地达成了完全无损(Zero Accuracy Loss)的精度表现,重新定义了 AI 推理效率的上限。
在日益增长的长文本与高并发 Agent 应用场景下,TurboQuant 通过对 KV Cache 的深度优化,最大程度地释放了显存空间,使得单卡能够支持更长的上下文长度与更大规模的并发请求。
这一技术的落地,标志着大模型推理成本与响应延迟将进入全新的量级,实现了从“计算受限”到“存储优化”的重要跃迁,该技术有望成为未来大模型基础设施的标准配置。
风险提示:技术路线变革具有不确定性;行业竞争加剧。
国联民生计算机 吕伟/周慧敏
该压缩算法可让AI 推理速度提升 8 倍,同时内存占用减少 6 倍。
它仅在推理阶段作用于键值缓存(KV Cache),能让单块 GPU 产出更多推理结果。
考虑到可观的投资回报空间,这对云服务商与大语言模型而言是积极信号,长期来看也利好算力与内存行业。
对内存领域的影响:长期中性偏正面
短期影响
TurboQuant 仅针对推理阶段的键值缓存(即随上下文长度增长的临时键值向量),不会影响模型权重(GPU/TPU 上的高带宽内存 HBM 占用)与训练任务。
但它能让相同硬件支持4-8 倍更长的上下文,或在内存不溢出的前提下大幅提升批处理大小。
这并非内存总需求或硬件总量减少 6 倍,而是通过效率提升增加单 GPU 吞吐量。
长期影响
会出现杰文斯悖论效应:效率提升反而会推升整体需求。
AI 推理的经济逻辑正在改变
通过压缩数据体积与数据传输量,TurboQuant 旨在提升单加速芯片的吞吐量、降低单次查询成本。
当前 AI 服务规模化最大的瓶颈正是键值缓存内存。
若模型能在不损失性能的前提下大幅降低内存需求,单次查询服务成本将显著下降,让 AI 部署更具盈利性。
这意味着原本需要云端集群支持的模型,如今可在本地硬件上运行,有效降低了 AI 规模化部署的门槛。
更多应用具备落地可行性、更多模型保持活跃,现有基础设施的利用率也会提升。
从这个角度看,TurboQuant 不只是一次渐进式优化,更是重塑 AI 部署成本曲线的突破。
更广泛的技术影响:又一个类似深度求索(DeepSeek)的重要突破
对云服务商与模型平台而言是积极信号:在长上下文推理与依赖检索的应用场景中,单位质量成本大幅降低带来了可观的投资回报价值。
对算力与内存的短期影响偏中性:更好的压缩技术会降低单次任务的内存访问量与 GPU 耗时,但单 Token 成本下降也可能刺激产品使用需求增长(如更大批处理量、更长上下文)。
由于压缩技术可直接集成进平台基础设施,这对软件层面可能形成边际利空。
公司3月25日于科创板上市,首日涨幅102.82%
公司是全球硅基OLED微显示领域龙头,率先实现12英寸硅基OLED产线大规模量产,打破了国际巨头索尼等对行业高端市场的垄断。
出货量和市占率方面,2024年视涯科技在全球XR设备硅基OLED出货量中市占率达35.2%,排名全球第二、国内第一(仅次于索尼),是全球唯二实现百万级出货的厂商之一。
客户方面,视涯科技已成为全球一线品牌的战略供应商,核心客户包括字节跳动、影石创新、雷鸟、联想等XR和消费电子行业头部企业,目前还与某全球XR领域龙头客户签署协议,锁定2026年起每年数百万片大额订单。
展望未来,随着全球XR、AI智能终端及新型显示市场的持续爆发,视涯科技有望凭借持续创新和头部客户深度绑定,实现出货量再创新高,全面巩固和提升其全球硅基OLED微显示行业的领先地位。
开源中小盘 周佳/赵晨旭或对口销售
构建数据中心电源平台化能力
拟以4.08亿元自有资金受让慧能泰53.09%股权,交易完成后将其纳入合并报表。慧能泰核心亮点在【电源控制和模拟芯片】,在低压侧已进入海外供应链,有望配合公司功率器件形成“数字+模拟+功率”矩阵,进一步配合放量。
聚焦数据中心:东微25年服务器电源收入占比已达40%,Q1服务器相关收入同比增长较强,公司的AI敞口在并入慧能泰后将进一步放大。
*公开资料整理,仅作为行业分析参考,不构成任何投资建议!