幻方DeepSeek:国产AI新黑马
发布者:乐晴
近期,幻方量化旗下DeepSeek V3上线,并同步开源。
在多项基准测试中,V3的成绩超越了主流开源模型,并和世界顶尖的闭源模型不分伯仲。 有人做了初步评测,结论是:DeepSeek V3已经与GPT-4o、Claude-3.5-sonnet推理能力相当,甚至编程媲美最领先的3.5 Sonnet,超过GPT-4o。
DeepSeek是一款由幻方量化推出的基于深度学习技术的大型语言模型(LLM),旨在通过模拟人类大脑的神经网络结构来处理和分析复杂的数据。其具备强大的语言处理能力、高效的计算推理能力、创新的模型架构以及高性价比。
几天前国外采访OpenAI员工,对DeepSeek的评价相当之高:
:DeepSeek-V2的低价策略引发了中国大模型市场的价格战,
:DeepSeek-V3在性能、成本和效率方面的卓越表现,为行业树立了新的标杆。 DeepSeek-V3的训练成本相对较低,使用2048块GPU,仅花费557.6万美元就成功训练出了这一性能卓越的模型。
DeepSeek
AI底层模型降低成本趋势初显,趋势有望长期延续,利好应用开发成本降低
-每日互动是幻方量化的二股东,其联合创始人徐进也是幻方量化的技术负责人,双方在高层管理上存在紧密联系。
-每日互动作为数据智能服务商,与幻方量化的DeepSeek在用户行为语料、算力合作以及营销客户推广方面存在合作,其牵头的浙江大数据计算中心为幻方大模型提供算力支持。
-卓创资讯与幻方量化在金融语料库方面存在合作。
-阳光照明购买了幻方量化的3亿元产品,叠加其电器出海业务(外销占比75%),可能与DeepSeek的国际化布局存在协同效应。
-航锦科技旗下超擎数智为DeepSeek提供光模块和交换机,双方深度合作,超擎是英伟达GPU、网络双Elite精英级合作伙伴;相关厂商还包括飞利信、海天瑞声等。
前Google Search团队成员Deedy表示DeepSeek-V3可能是目前全球最强的开源大模型之一。
需要注意的是,也有人认为,DeepSeek是站在巨人的肩膀上,使用大量高质量合成数据。DeepSeek这个统计口径只计算了训练,但数据的配比需要做大量的预实验,合成数据的生成和清洗也需要消耗算力。
*本文仅供行业分析参考,不构成投资建议!