🔍
访问官网DeepSeek-V3
开源深度求索 · 2025-05
深度求索最新旗舰模型,685B MoE 架构,编程性能卓越。
快速概览
参数量
685B total (37B active per token)
上下文窗口
128K tokens
模态
text
开源
是
许可证
MIT
价格
免费 / API 从 $0.27/百万 token
发布日期
2025-05
开发者
深度求索
关于
DeepSeek-V3 是深度求索最新的旗舰大语言模型,总参数量 6850 亿,采用混合专家架构(每 token 激活 370 亿)。相比 DeepSeek-R1 在通用知识、编程能力和对话能力方面均有提升。MoE 架构仅 5.4% 参数每 token 激活意味着以计算成本的一小部分获得近 700B 参数模型的能力。API 约每百万 token 0.27 美元,约为 GPT-4o 成本的十分之一。在关键基准测试上与 GPT-4o 和 Claude 3.5 Sonnet 竞争。MIT 许可下的开源权重发布。
优势
- +开源权重,MIT 许可
- +685B MoE 架构带来强劲性能
- +卓越的编程和推理基准
- +极高的 API 性价比
不足
- −仅文本模型,无视觉或多模态
- −对话细腻度仍不及 GPT-4o
- −服务器可用性不稳定
适用场景
在自有基础设施上部署强大 AI
复杂编程和算法挑战
大规模高性价比 API 集成
开源权重模型研究和实验
价格
免费聊天
$0
- 无限 DeepSeek 聊天
- V3 模型
- 文件上传
API
From $0.27/M tokens
- V3 API
- 速率限制
- 支持微调
自部署
Free (open-weight)
- 完整模型权重
- 自定义部署
- 无限使用
基准测试
| 基准 | DeepSeek-V3 | 对比模型 |
|---|---|---|
| MMLU | 88.5% | GPT-4o: 88.7% |
| HumanEval | 90.5% | Claude 3.5 Sonnet: 92.0% |
技术规格
参数量
685B total (37B active per token)
上下文窗口
128K tokens
模态
text
语言
EnglishChinese
开源
是
许可证
MIT
分享这篇文章