08月23日,星期三 03:30
火讯财经讯,据站长之家8月23日报道,人工智能创业公司HuggingFace最近推出了一款名为IDEFIX的开源多模态AI模型。IDEFIX可以处理图像和文本输入,并生成连贯的文本输出。IDEFIX基于视觉语言模型Flamingo构建,Flamingo是去年由DeepMind开发的一款领先的多模态AI模型。IDEFIX使用了包括维基百科、公共多模态数据集和LAION在内的各种开放数据集进行了训练。此外,HuggingFace还引入了一个新的多模态数据集OBELIX,其中包含1.41亿个从互联网收集的图像文本文档。与专有模型相比,IDEFIX在各种图像文本理解评估中的表现非常优异。它有两个版本,基本版本有90亿个参数,指导版本有800亿个参数。相比之下,OpenAI的ChatGPT目前还不支持处理图像。此前报道,知情人士:Salesforce正在领投HuggingFace的新一轮融资。