通

通义千问VL

阿里云

免费国内NEW

工具介绍

通义千问的视觉语言多模态版本，支持图片理解、视觉问答、文档OCR解析和图文创作。

Tongyi Qianwen's visual language multimodal version supporting image understanding, visual Q&A, document OCR and image-text creation.

标签：通义千问多模态图文理解阿里

380,011 次浏览 15,200 次收藏

点击将跳转至 tongyi.aliyun.com

定价免费

地区国内

出品方阿里云

API暂未开放

成为第一个评价的人，帮助其他人了解它

NEW

AI多模态

百度最新发布的文心大模型4.0，具备多模态理解、长文本生成和专业知识推理能力，支持插件扩展。

NEW

AI多模态

智谱AI推出的GLM-4V多模态视觉理解模型，支持图文混合输入，具备强大的图像理解和视觉推理能力。

NEW

AI多模态

上海AI实验室推出的开源大语言模型InternLM，提供强大的多模态理解和代码生成能力，面向全球开发者开放。