AI Study Online
🔍

DeepSeek-R1

开源

深度求索 · 2025-01

开源权重推理模型,具备思维链能力,媲美顶级闭源模型。

访问官网

快速概览

参数量

671B total (37B active per token)

上下文窗口

128K tokens

模态

text

开源

许可证

MIT

价格

免费 / API 从 $0.14/百万 token

发布日期

2025-01

开发者

深度求索

关于

DeepSeek-R1 是深度求索开发的一款突破性的开源权重推理模型。它采用混合专家架构,总参数量 6710 亿,每个 token 激活 370 亿参数。R1 引入了显式思维链推理,在数学推理、编程和科学问题求解方面表现出与 OpenAI o1 相当的性能。其宽松许可下的开源权重发布在 AI 社区引发了广泛采用。以专有模型零头的成本,DeepSeek-R1 使高级推理 AI 的获取更加民主化。

优势

  • +开源权重,MIT 许可
  • +思维链推理媲美顶级专有模型
  • +极高的成本效益(竞争对手 API 成本的零头)
  • +优秀的数学和编程性能

不足

  • 仅支持文本,无视觉或多模态能力
  • 对话能力不如闭源模型细腻
  • 服务器可用性不稳定
  • 文档主要以中文为主

适用场景

在自有基础设施上自部署高级推理 AI

数学问题求解和证明

竞赛编程和算法挑战

大规模成本敏感的 AI 集成

价格

免费聊天

$0

  • 无限 DeepSeek 聊天
  • DeepSeek-R1 模型
  • 文件上传

API

From $0.14/M tokens

  • R1 和 V3 API
  • 速率限制
  • 支持微调

自部署

Free (open-weight)

  • 完整模型权重
  • 自定义部署
  • 无限使用

基准测试

基准DeepSeek-R1对比模型
AIME 202579.8%o1 (OpenAI): 79.2%
MATH-50097.3%o1: 96.4%

技术规格

参数量

671B total (37B active per token)

上下文窗口

128K tokens

模态

text

语言

EnglishChinese

开源

许可证

MIT

开发者

深度求索

发布日期: 2025-01

分享这篇文章

相关模型