多模态综述 发表于 2024-07-23 更新于 2024-08-13 分类于 深度学习 阅读次数: Valine: 本文字数: 61 阅读时长 ≈ 1 分钟 一、多模态大模型的发展历程 二、多模态大模型的输入-输出空间 (1)视觉编码器架构 (2)离散化视觉表示 (3)视觉编码器训练策略