阿里云
通义千问的视觉语言多模态版本,支持图片理解、视觉问答、文档OCR解析和图文创作。
Tongyi Qianwen's visual language multimodal version supporting image understanding, visual Q&A, document OCR and image-text creation.
点击将跳转至 tongyi.aliyun.com
AI多模态
智谱AI推出的GLM-4V多模态视觉理解模型,支持图文混合输入,具备强大的图像理解和视觉推理能力。
百度最新发布的文心大模型4.0,具备多模态理解、长文本生成和专业知识推理能力,支持插件扩展。
零一万物推出的Yi系列大模型聊天应用,支持超长上下文(200K),在中文和英文能力上表现优秀,完全免费。
上海AI实验室推出的开源大语言模型InternLM,提供强大的多模态理解和代码生成能力,面向全球开发者开放。