931 天前

09月19日,星期二 09:30

北京交通大学等机构推出多模态大模型 MMICL,支持文本图像视频输入

火讯财经讯,据站长之家9月19日报道,北京交通大学等机构近日联合推出了新多模态大模型MMICL。它支持文本、图像、视频三种模态的混合输入。据悉,MMICL在MMBench和MME两项多模态测评中均获得不俗的成绩,它采用Flan-T5XXL作为基础模型,通过两阶段训练完成。第一阶段是预训练,使用大规模数据集;第二阶段是多模态上下文微调,使用自建包含丰富多模态样本的MIC数据集。这种训练方式让MMICL既具备强大的语义理解能力,又特别适合处理复杂的多模态输入。目前,MMICL已开源两个版本,分别基于FlanT5XL和Vicuna模型,可满足商用和科研需求。

3
0
  • 标普500和纳斯达克指数期货分别上涨 1% 和 1.2%

    火讯财经讯,标普500指数期货上涨1%,纳斯达克指数期货上涨1.2%。

    4 分钟前

  • 杰斐逊:当前政策利率已处于中性区间,准备应对市场变化

    火讯财经讯,美联储副主席杰斐逊表示,当前政策利率已做好充分准备应对市场变化,利率大致处于中性区间。

    13 分钟前

  • 杰斐逊:美联储对经济前景持谨慎态度

    火讯财经讯,美联储副主席杰斐逊因不确定性加剧,对经济前景持谨慎态度。

    13 分钟前

  • 杰斐逊:就业面临下行风险,通胀面临上行风险

    火讯财经讯,美联储副主席杰斐逊表示,当前就业市场面临下行风险,而通胀则面临上行风险。

    13 分钟前

  • 杰斐逊:持续高企的能源价格将拖累消费者和企业支出

    火讯财经讯,美联储副主席杰斐逊表示,持续高企的能源价格会拖累消费者和企业支出。

    14 分钟前