🔍
访问官网DeepSeek-R1
开源深度求索 · 2025-01
开源权重推理模型,具备思维链能力,媲美顶级闭源模型。
快速概览
参数量
671B total (37B active per token)
上下文窗口
128K tokens
模态
text
开源
是
许可证
MIT
价格
免费 / API 从 $0.14/百万 token
发布日期
2025-01
开发者
深度求索
关于
DeepSeek-R1 是深度求索开发的一款突破性的开源权重推理模型。它采用混合专家架构,总参数量 6710 亿,每个 token 激活 370 亿参数。R1 引入了显式思维链推理,在数学推理、编程和科学问题求解方面表现出与 OpenAI o1 相当的性能。其宽松许可下的开源权重发布在 AI 社区引发了广泛采用。以专有模型零头的成本,DeepSeek-R1 使高级推理 AI 的获取更加民主化。
优势
- +开源权重,MIT 许可
- +思维链推理媲美顶级专有模型
- +极高的成本效益(竞争对手 API 成本的零头)
- +优秀的数学和编程性能
不足
- −仅支持文本,无视觉或多模态能力
- −对话能力不如闭源模型细腻
- −服务器可用性不稳定
- −文档主要以中文为主
适用场景
在自有基础设施上自部署高级推理 AI
数学问题求解和证明
竞赛编程和算法挑战
大规模成本敏感的 AI 集成
价格
免费聊天
$0
- 无限 DeepSeek 聊天
- DeepSeek-R1 模型
- 文件上传
API
From $0.14/M tokens
- R1 和 V3 API
- 速率限制
- 支持微调
自部署
Free (open-weight)
- 完整模型权重
- 自定义部署
- 无限使用
基准测试
| 基准 | DeepSeek-R1 | 对比模型 |
|---|---|---|
| AIME 2025 | 79.8% | o1 (OpenAI): 79.2% |
| MATH-500 | 97.3% | o1: 96.4% |
技术规格
参数量
671B total (37B active per token)
上下文窗口
128K tokens
模态
text
语言
EnglishChinese
开源
是
许可证
MIT
分享这篇文章