DeepSeek上新！开源发布DeepSeek-Prover-V2-671B新模型！

流沙数科 2025-05-01 07:47:57 225

4月30日消息，今日下午，DeepSeek 在 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。

据介绍，DeepSeek-Prover-V2-671B 其参数量达到6710亿，使用了更高效的 safetensors 文件格式，并支持 BF16、FP8、F32 等多种计算精度，方便模型更快、更省资源地训练和部署。

在模型架构上，该模型使用了DeepSeek-V3架构，采用MoE（混合专家）模式，具有61层Transformer层，7168维隐藏层。

同时支持超长上下文，最大位置嵌入达163840，使其能处理复杂的数学证明，并且采用了FP8量化，可通过量化技术减小模型大小，提高推理效率。

有网友分析，该模型被视为 Prover-V1.5的升级版，专注于形式化定理证明，专门用于攻克数学难题，擅长自动证明定理和复杂计算，类似于 AlphaGo 在围棋中的自我对弈方式。

接下来它的性能测试表现会如何，值得期待。

DeepSeek上新！开源发布DeepSeek-Prover-V2-671B新模型 ！