半导体+光电更新 ①受CPU...

发布者：乐晴

①受CPU供应紧张的报道，英特尔和AMD隔夜均涨超7%；Arm大涨16.38%，公布自研AGI CPU并给出超预期营收增长展望。

②美股存储板块全线下跌，美光科技迎来日线5连跌，闪迪、西部数据和希捷下跌。受日前谷歌发布能“显著压缩KV缓存”的技术Google TurboQuant影响，或引发存储下跌。

③闪迪公司：根据SEC文件披露，闪迪旗下部门将以10亿美元收购南亚科技1.39亿股股份，占股比例为3.9%。

④今日沐曦股份等股将披露2025年报。

⑤受原材料价格持续上涨等因素影响，LED全产业链密集调价。

1）据报道，英特尔和AMD告知客户上调3月和4月CPU价格。CPU涨价趋势持续，主要系产能受限以及AI Agent等AI发展引起的CPU需求持续上调。

2）Agent时代来临，基础设施建设重心有望转向“CPU强调度”，CPU的量和性能的需求持续超预期。

随着“龙虾人”等AI Agent的普及，AI负载范式正从静态推理转向动态调度。由于Agent涉及高频的工具调用、沙盒隔离及多步规划，这些任务对CPU的单核性能、内存带宽及虚拟化效率产生了刚性需求。AI算力的瓶颈正在向CPU端偏移，未来CPU的核数与性能需求有望迎来爆发式增长。

3）国产CPU有望量价齐升，X86、ARM架构国产CPU有望持续主导

当前中国 CPU 市场处于算力需求爆发与国产替代共振的拐点，Intel、AMD CPU 因供需错配而涨价缺货。国产高端CPU有望量价齐升，开启替代红利与自主红利双重奏。目前国产服务器CPU市场已形成“多路并行”格局，其中 ARM 与 X86 架构占据主导地位。海光信息作为国产X86高端服务器CPU龙头，禾盛新材增资的熠知电子作为国内稀缺的商业化ARM V9架构服务器CPU先锋，皆有望持续受益。

我们看好AI Agent爆发下来带的CPU需求提升以及国产CPU的长期发展趋势，相关：海光信息、禾盛新材等。

闪迪：约10亿美元收购南亚科约1.39亿股普通股，占交易完成后的3.9%，交易价格平均折价15%，与股权交易同步的是闪迪和南亚科达成多年期战略合作供应协议，南亚科将向闪迪持续供应DRAM产品，支持其长期DRAM采购策略。

铠侠：全资子公司参与南亚科定向增发，并与其签订DRAM长期供应先可以，铠侠认购南亚科7000万股约5亿美元普通股。旨在强化SSD业务所需DRAM组件的中长期稳定供应。

为什么SSD公司需要DRAM？通常SSD有主控芯片+NAND组成，但是在不同种类的SSD中，处理内存的方式各不相同，高性能SSD中缓冲内存是一个独立的DRAM芯片，以提高速率和性能；低端SSD中缓冲内存可能会集成到主控芯片中，或者不内置任何缓冲内存，而是使用host memory的一部分。

闪迪和铠侠参股南亚科，以期保障DRAM供应，我们认为是其对高端市场的长期需求前景的乐观展望表现，无需过多忧虑，是在超级周期下，高增长AI市场保障供应的灵活手段之一。近期国内佰维等公司披露15亿美元2年期晶圆保障协议，亦是产业针对未来市场乐观的体现，在没有出现明显的恶化信号之前，仍建议对产业链保持积极态度。

鄢凡/谌薇/王焱仟

Google TurboQuant 专为大模型推理（LLM Inference）中的内存瓶颈与效率难题而打造。

作为一种创新的新型压缩算法，它实现了 LLM 键值（KV）缓存内存至少 6 倍的显著减少，并带来高达 8 倍的端到端推理速度提升。在极致压缩的同时，该技术突破性地达成了完全无损（Zero Accuracy Loss）的精度表现，重新定义了 AI 推理效率的上限。

在日益增长的长文本与高并发 Agent 应用场景下，TurboQuant 通过对 KV Cache 的深度优化，最大程度地释放了显存空间，使得单卡能够支持更长的上下文长度与更大规模的并发请求。

这一技术的落地，标志着大模型推理成本与响应延迟将进入全新的量级，实现了从“计算受限”到“存储优化”的重要跃迁，该技术有望成为未来大模型基础设施的标准配置。

风险提示：技术路线变革具有不确定性；行业竞争加剧。

国联民生计算机吕伟/周慧敏

该压缩算法可让AI 推理速度提升 8 倍，同时内存占用减少 6 倍。

它仅在推理阶段作用于键值缓存（KV Cache），能让单块 GPU 产出更多推理结果。

考虑到可观的投资回报空间，这对云服务商与大语言模型而言是积极信号，长期来看也利好算力与内存行业。

对内存领域的影响：长期中性偏正面

短期影响

TurboQuant 仅针对推理阶段的键值缓存（即随上下文长度增长的临时键值向量），不会影响模型权重（GPU/TPU 上的高带宽内存 HBM 占用）与训练任务。

但它能让相同硬件支持4-8 倍更长的上下文，或在内存不溢出的前提下大幅提升批处理大小。

这并非内存总需求或硬件总量减少 6 倍，而是通过效率提升增加单 GPU 吞吐量。

长期影响

会出现杰文斯悖论效应：效率提升反而会推升整体需求。

AI 推理的经济逻辑正在改变

通过压缩数据体积与数据传输量，TurboQuant 旨在提升单加速芯片的吞吐量、降低单次查询成本。

当前 AI 服务规模化最大的瓶颈正是键值缓存内存。

若模型能在不损失性能的前提下大幅降低内存需求，单次查询服务成本将显著下降，让 AI 部署更具盈利性。

这意味着原本需要云端集群支持的模型，如今可在本地硬件上运行，有效降低了 AI 规模化部署的门槛。

更多应用具备落地可行性、更多模型保持活跃，现有基础设施的利用率也会提升。

从这个角度看，TurboQuant 不只是一次渐进式优化，更是重塑 AI 部署成本曲线的突破。

更广泛的技术影响：又一个类似深度求索（DeepSeek）的重要突破

对云服务商与模型平台而言是积极信号：在长上下文推理与依赖检索的应用场景中，单位质量成本大幅降低带来了可观的投资回报价值。

对算力与内存的短期影响偏中性：更好的压缩技术会降低单次任务的内存访问量与 GPU 耗时，但单 Token 成本下降也可能刺激产品使用需求增长（如更大批处理量、更长上下文）。

由于压缩技术可直接集成进平台基础设施，这对软件层面可能形成边际利空。

公司3月25日于科创板上市，首日涨幅102.82%

公司是全球硅基OLED微显示领域龙头，率先实现12英寸硅基OLED产线大规模量产，打破了国际巨头索尼等对行业高端市场的垄断。

出货量和市占率方面，2024年视涯科技在全球XR设备硅基OLED出货量中市占率达35.2%，排名全球第二、国内第一（仅次于索尼），是全球唯二实现百万级出货的厂商之一。

客户方面，视涯科技已成为全球一线品牌的战略供应商，核心客户包括字节跳动、影石创新、雷鸟、联想等XR和消费电子行业头部企业，目前还与某全球XR领域龙头客户签署协议，锁定2026年起每年数百万片大额订单。

展望未来，随着全球XR、AI智能终端及新型显示市场的持续爆发，视涯科技有望凭借持续创新和头部客户深度绑定，实现出货量再创新高，全面巩固和提升其全球硅基OLED微显示行业的领先地位。

开源中小盘周佳/赵晨旭或对口销售

构建数据中心电源平台化能力

拟以4.08亿元自有资金受让慧能泰53.09%股权，交易完成后将其纳入合并报表。慧能泰核心亮点在【电源控制和模拟芯片】，在低压侧已进入海外供应链，有望配合公司功率器件形成“数字+模拟+功率”矩阵，进一步配合放量。

聚焦数据中心：东微25年服务器电源收入占比已达40%，Q1服务器相关收入同比增长较强，公司的AI敞口在并入慧能泰后将进一步放大。

*公开资料整理，仅作为行业分析参考，不构成任何投资建议！