AI Study Online
🌐

通义千问VL-Max

阿里云 · 2025

阿里云的旗舰多模态模型,中英文视觉语言理解能力领先。

访问官网

快速概览

参数量

Undisclosed (estimated ~100B+)

上下文窗口

128K tokens

模态

text, image

开源

价格

API 从约 $0.50/百万 token

发布日期

2025

开发者

阿里云

关于

通义千问VL-Max 是阿里云的旗舰多模态大语言模型,属于通义千问系列。它在视觉语言理解任务上表现出色,包括图像描述、视觉问答、文档理解和多图像推理。Qwen-VL-Max 在中文和英文环境下都有强劲表现,擅长处理图表解读、图表理解和详细图像分析等复杂视觉推理任务。在理解中文文化语境、文档和场景方面尤为出色。

优势

  • +中文语境下领先的视觉语言理解
  • +强大的文档和图表分析能力
  • +中英双语熟练
  • +良好的多图像推理能力

不足

  • 亚洲以外地区可用性有限
  • 全球社区和生态系统较小
  • 非视觉推理任务能力较弱

适用场景

中文文档和图像理解

双语视觉问答应用

中国文化语境分析

文档数字化和理解

价格

免费(网页版)

$0

  • 有限通义千问对话
  • 基础视觉任务
  • 文件上传

API

From ~$0.50/1M tokens

  • 按量计费
  • 视觉语言能力
  • 128K 上下文

技术规格

参数量

Undisclosed (estimated ~100B+)

上下文窗口

128K tokens

模态

text, image

语言

ChineseEnglish

开源

开发者

阿里云

发布日期: 2025

分享这篇文章

相关模型