11月14日,星期二 01:00
火讯财经讯,据VentureBeat报道,总部位于芬兰赫尔辛基的人工智能初创公司SiloAI本周发布了新开源大型语言模型“Poro”,旨在提升欧洲语言的多语言人工智能能力。Poro是计划中的首个开源模型,旨在最终涵盖欧盟所有24种官方语言。这些模型由SiloAI的SiloGen生成人工智能部门和图尔库大学的TurkuNLP研究小组共同开发。Poro34B模型拥有342亿参数,以芬兰语中“驯鹿(reindeer)”一词命名。它是在21万亿个token多语言数据集的一个分区上进行训练的,这些数据集涵盖英语、芬兰语以及Python和Java等编程语言。SiloAI首席执行官PeterSarlin表示,Poro的设计目的是解决为欧洲低资源语言(如芬兰语)训练性能卓越的核心挑战。通过利用跨语言训练方法,模型能够利用来自高资源语言(如英语)的数据。