🌐
访问官网通义千问VL-Max
阿里云 · 2025
阿里云的旗舰多模态模型,中英文视觉语言理解能力领先。
快速概览
参数量
Undisclosed (estimated ~100B+)
上下文窗口
128K tokens
模态
text, image
开源
否
价格
API 从约 $0.50/百万 token
发布日期
2025
开发者
阿里云
关于
通义千问VL-Max 是阿里云的旗舰多模态大语言模型,属于通义千问系列。它在视觉语言理解任务上表现出色,包括图像描述、视觉问答、文档理解和多图像推理。Qwen-VL-Max 在中文和英文环境下都有强劲表现,擅长处理图表解读、图表理解和详细图像分析等复杂视觉推理任务。在理解中文文化语境、文档和场景方面尤为出色。
优势
- +中文语境下领先的视觉语言理解
- +强大的文档和图表分析能力
- +中英双语熟练
- +良好的多图像推理能力
不足
- −亚洲以外地区可用性有限
- −全球社区和生态系统较小
- −非视觉推理任务能力较弱
适用场景
中文文档和图像理解
双语视觉问答应用
中国文化语境分析
文档数字化和理解
价格
免费(网页版)
$0
- 有限通义千问对话
- 基础视觉任务
- 文件上传
API
From ~$0.50/1M tokens
- 按量计费
- 视觉语言能力
- 128K 上下文
技术规格
参数量
Undisclosed (estimated ~100B+)
上下文窗口
128K tokens
模态
text, image
语言
ChineseEnglish
开源
否
开发者
阿里云
发布日期: 2025
分享这篇文章