阿里大模型又开源!能读图会识物,基于通义千问7B打造,可商用

转载
389 天前
9979
AIGC

文章转载来源:AIGC

来源:量子位

阿里开源大模型,又上新了~

继通义千问-7B(Qwen-7B)之后,阿里云又推出了大规模视觉语言模型Qwen-VL,并且一上线就直接开源。

具体来说,Qwen-VL是基于通义千问-7B打造的多模态大模型,支持图像、文本、检测框等多种输入,并且在文本之外,也支持检测框的输出。

举个