返回话题列表
乐晴行业观察
2025/01/26 23:59
类型 talk 22阅读 1

字节SeedEdge项目解析

发布者:乐晴

近期国产模型进展迅速,头部追上o1和GPT-4o,DeepSeek平权了RL强化学习模型的训练门槛。

👉🏻幻方DeepSeek:国产AI新黑马 👉🏻DeepSeek产业链最新解析今日在“乐晴智库精选”公众号发布

字节豆包大模型团队上周也正式启动SeedEdge研究项目,旨在加码AGI(通用人工智能)研究,其核心目标是做比预训练和大模型迭代更长期,更基础的AGI前沿研究。

项目代号Seed代表豆包大模型团队名称,Edge代表最前沿的AGI探索。

目前,SeedEdge初步确定了五大研究方向,将为所有入选课题提供单独的算力资源保障。据晚点,该项目涉及:高效通用的推理;世界模型和感知(这个或和机器人有关);探索Transformer+GPU之外的模型设计,适配未来可能的新硬件架构;模型新结构和训练方法探索;多智能体、推理ScalingLaw等。

具体包括:

1、探索推理能力的边界:聚焦于通过大规模强化学习等技术推动智能边界的提升。 2、探索感知能力的边界:致力于突破智能与交互的融合,探索世界模型的建模方式。 3、探索软硬一体的下一代模型设计:旨在实现训练效率、推理效率、模型性能的多目标优化。 4、探索下一代AI学习范式:挑战现有范式的“共识”,寻找比Next-Token Prediction更高效的学习目标。 5、探索下一个Scaling方向:继Pretraining Scaling和Test-Time Scaling之后,寻找推动智能边界演进的新方向。

人才储备方面,2024年5月,字节启动了“Top Seed人才计划”,通过该计划在全球范围内招募顶尖博士毕业生加入豆包大模型团队。

产业链方面,字节跳动通过火山引擎来构建算力基础设施,提供强大的计算能力、数据存储、网络传输等服务;数据中心环节,字节与润泽等核心供应商合作;浪潮等服务器厂商为字节提供服务器设备;高澜等厂商在液冷技术方面为字节算力基础设施建设提供支持。

海天瑞声为字节提供智能语音计算机视觉和自然语言等各类数据产品或服务;智能知识库等解决方案中,软通动力与火山引擎(字节跳动旗下云计算平台)通过渠道共享等方式开展合作;蓝色光标与火山引擎达成深度合作,双方将基于火山方舟、豆包视频生成模型、扣子专业版智能体开发平台,在视频生成等智能体应用等领域展开合作;光迅为字节跳动提供400G及800G光模块产品。

AI是字节目前最看重的技术和业务方向,未来字节可能形成以豆包AI为核心的硬件产品矩阵,包括办公、教育、陪伴等多类产品。

1、AI SoC芯片:AI应用终端产品算力提供者 2、豆包首款AI硬件耳机核心存储芯片:NOR Flash解析 3、字节情感大模型开启灰测:核心环节梳理 4、豆包视觉理解模型核心图形处理芯片:ISP解析 5、字节AI应用会议核心要点分享

*本文仅作为行业分析参考,不构成投资建议!