🔍

DeepSeek-R1

Name: DeepSeek-R1
Price: Free / API from $0.14/M tokens USD
Author: DeepSeek

开源

深度求索 · 2025-01

开源权重推理模型，具备思维链能力，媲美顶级闭源模型。

访问官网

快速概览

参数量

671B total (37B active per token)

上下文窗口

128K tokens

模态

text

开源

是

许可证

MIT

价格

免费 / API 从 $0.14/百万 token

发布日期

2025-01

开发者

深度求索

关于

DeepSeek-R1 是深度求索开发的一款突破性的开源权重推理模型。总参数量 6710 亿，采用混合专家架构每 token 仅激活 370 亿参数。其关键创新在于显式思维链推理——逐步展示推理过程后才得出结论。在 MATH-500 上达到 97.3%，在 AIME 2025 上达到 79.8%，与 OpenAI o1 竞争。MIT 许可下的开源权重发布是 AI 可及性的分水岭时刻。API 价格约每百万 token 0.14 美元，远低于专有替代方案。对于自部署组织、成本敏感型初创公司和研究人员来说，DeepSeek-R1 以极低成本提供前沿推理能力。

优势

+开源权重，MIT 许可
+思维链推理媲美顶级专有模型
+极高的成本效益（竞争对手 API 成本的零头）
+优秀的数学和编程性能

不足

−仅支持文本，无视觉或多模态能力
−对话能力不如闭源模型细腻
−服务器可用性不稳定
−文档主要以中文为主

适用场景

在自有基础设施上自部署高级推理 AI

数学问题求解和证明

竞赛编程和算法挑战

大规模成本敏感的 AI 集成

价格

免费聊天

无限 DeepSeek 聊天
DeepSeek-R1 模型
文件上传

API

From $0.14/M tokens

R1 和 V3 API
速率限制
支持微调

自部署

Free (open-weight)

完整模型权重
自定义部署
无限使用

基准测试

基准	DeepSeek-R1	对比模型
AIME 2025	79.8%	o1 (OpenAI): 79.2%
MATH-500	97.3%	o1: 96.4%

技术规格

参数量

671B total (37B active per token)

上下文窗口

128K tokens

模态

text

语言

EnglishChinese

开源

是

许可证

MIT

开发者

深度求索

发布日期: 2025-01

API文档 GitHub

分享这篇文章

DeepSeek-R1

快速概览

关于

优势

不足

适用场景

价格

免费聊天

API

自部署

基准测试

技术规格

开发者

相关模型

GPT-4o

GPT-5

Claude 3.5 Sonnet

Claude 4 Opus