AI Study Online
🔍

DeepSeek-V3

开源

深度求索 · 2025-05

深度求索最新旗舰模型,685B MoE 架构,编程性能卓越。

访问官网

快速概览

参数量

685B total (37B active per token)

上下文窗口

128K tokens

模态

text

开源

许可证

MIT

价格

免费 / API 从 $0.27/百万 token

发布日期

2025-05

开发者

深度求索

关于

DeepSeek-V3 是深度求索最新的旗舰大语言模型,总参数量 6850 亿,采用混合专家架构(每 token 激活 370 亿)。相比 DeepSeek-R1 在通用知识、编程能力和对话能力方面均有提升。MoE 架构仅 5.4% 参数每 token 激活意味着以计算成本的一小部分获得近 700B 参数模型的能力。API 约每百万 token 0.27 美元,约为 GPT-4o 成本的十分之一。在关键基准测试上与 GPT-4o 和 Claude 3.5 Sonnet 竞争。MIT 许可下的开源权重发布。

优势

  • +开源权重,MIT 许可
  • +685B MoE 架构带来强劲性能
  • +卓越的编程和推理基准
  • +极高的 API 性价比

不足

  • 仅文本模型,无视觉或多模态
  • 对话细腻度仍不及 GPT-4o
  • 服务器可用性不稳定

适用场景

在自有基础设施上部署强大 AI

复杂编程和算法挑战

大规模高性价比 API 集成

开源权重模型研究和实验

价格

免费聊天

$0

  • 无限 DeepSeek 聊天
  • V3 模型
  • 文件上传

API

From $0.27/M tokens

  • V3 API
  • 速率限制
  • 支持微调

自部署

Free (open-weight)

  • 完整模型权重
  • 自定义部署
  • 无限使用

基准测试

基准DeepSeek-V3对比模型
MMLU88.5%GPT-4o: 88.7%
HumanEval90.5%Claude 3.5 Sonnet: 92.0%

技术规格

参数量

685B total (37B active per token)

上下文窗口

128K tokens

模态

text

语言

EnglishChinese

开源

许可证

MIT

开发者

深度求索

发布日期: 2025-05

分享这篇文章

相关模型