幻方DeepSeek：国产AI新黑马

发布者：乐晴

近期，幻方量化旗下DeepSeek V3上线，并同步开源。

在多项基准测试中，V3的成绩超越了主流开源模型，并和世界顶尖的闭源模型不分伯仲。有人做了初步评测，结论是：DeepSeek V3已经与GPT-4o、Claude-3.5-sonnet推理能力相当，甚至编程媲美最领先的3.5 Sonnet，超过GPT-4o。

DeepSeek是一款由幻方量化推出的基于深度学习技术的大型语言模型（LLM），旨在通过模拟人类大脑的神经网络结构来处理和分析复杂的数据。其具备强大的语言处理能力、高效的计算推理能力、创新的模型架构以及高性价比。

几天前国外采访OpenAI员工，对DeepSeek的评价相当之高：

：DeepSeek-V2的低价策略引发了中国大模型市场的价格战，

：DeepSeek-V3在性能、成本和效率方面的卓越表现，为行业树立了新的标杆。 DeepSeek-V3的训练成本相对较低，使用2048块GPU，仅花费557.6万美元就成功训练出了这一性能卓越的模型。

DeepSeek

AI底层模型降低成本趋势初显，趋势有望长期延续，利好应用开发成本降低

-每日互动是幻方量化的二股东，其联合创始人徐进也是幻方量化的技术负责人，双方在高层管理上存在紧密联系。

-每日互动作为数据智能服务商，与幻方量化的DeepSeek在用户行为语料、算力合作以及营销客户推广方面存在合作，其牵头的浙江大数据计算中心为幻方大模型提供算力支持。

-卓创资讯与幻方量化在金融语料库方面存在合作。

-阳光照明购买了幻方量化的3亿元产品，叠加其电器出海业务（外销占比75%），可能与DeepSeek的国际化布局存在协同效应。

-航锦科技旗下超擎数智为DeepSeek提供光模块和交换机，双方深度合作，超擎是英伟达GPU、网络双Elite精英级合作伙伴；相关厂商还包括飞利信、海天瑞声等。

前Google Search团队成员Deedy表示DeepSeek-V3可能是目前全球最强的开源大模型之一。

需要注意的是，也有人认为，DeepSeek是站在巨人的肩膀上，使用大量高质量合成数据。DeepSeek这个统计口径只计算了训练，但数据的配比需要做大量的预实验，合成数据的生成和清洗也需要消耗算力。

*本文仅供行业分析参考，不构成投资建议！