12月22日,星期五 05:00
火讯财经讯,据站长之家12月22日报道,近期的Gemini-Pro评测报告显示其在多模态领域取得了显著的进展,与GPT-4V不相上下,甚至在某些方面表现更为出色。首先,在多模态专有基准MME上的综合表现中,Gemini-Pro以1933.4的高分超越了GPT-4V,展现出在感知和认知方面的全面优势。其次,在37个视觉理解任务中,Gemini-Pro在文本翻译、颜色/地标/人物识别、OCR等任务中表现突出,而GPT-4V在名人识别任务上得分为0。在高级认知、挑战性视觉任务和各种专家能力领域,Gemini-Pro展现了强大的视觉感知和理解能力,但在位置识别任务上表现都不佳。