🔍

DeepSeek-V3

Name: DeepSeek-V3
Price: Free / API from $0.27/M tokens USD
Author: DeepSeek

开源

深度求索 · 2025-05

深度求索最新旗舰模型，685B MoE 架构，编程性能卓越。

访问官网

快速概览

参数量

685B total (37B active per token)

上下文窗口

128K tokens

模态

text

开源

是

许可证

MIT

价格

免费 / API 从 $0.27/百万 token

发布日期

2025-05

开发者

深度求索

关于

DeepSeek-V3 是深度求索最新的旗舰大语言模型，总参数量 6850 亿，采用混合专家架构（每 token 激活 370 亿）。相比 DeepSeek-R1 在通用知识、编程能力和对话能力方面均有提升。MoE 架构仅 5.4% 参数每 token 激活意味着以计算成本的一小部分获得近 700B 参数模型的能力。API 约每百万 token 0.27 美元，约为 GPT-4o 成本的十分之一。在关键基准测试上与 GPT-4o 和 Claude 3.5 Sonnet 竞争。MIT 许可下的开源权重发布。

优势

+开源权重，MIT 许可
+685B MoE 架构带来强劲性能
+卓越的编程和推理基准
+极高的 API 性价比

不足

−仅文本模型，无视觉或多模态
−对话细腻度仍不及 GPT-4o
−服务器可用性不稳定

适用场景

在自有基础设施上部署强大 AI

复杂编程和算法挑战

大规模高性价比 API 集成

开源权重模型研究和实验

价格

免费聊天

无限 DeepSeek 聊天
V3 模型
文件上传

API

From $0.27/M tokens

V3 API
速率限制
支持微调

自部署

Free (open-weight)

完整模型权重
自定义部署
无限使用

基准测试

基准	DeepSeek-V3	对比模型
MMLU	88.5%	GPT-4o: 88.7%
HumanEval	90.5%	Claude 3.5 Sonnet: 92.0%

技术规格

参数量

685B total (37B active per token)

上下文窗口

128K tokens

模态

text

语言

EnglishChinese

开源

是

许可证

MIT

开发者

深度求索

发布日期: 2025-05

API文档 GitHub

分享这篇文章

DeepSeek-V3

快速概览

关于

优势

不足

适用场景

价格

免费聊天

API

自部署

基准测试

技术规格

开发者

相关模型

GPT-4o

GPT-5

Claude 3.5 Sonnet

Claude 4 Opus