文章转载来源:学术头条
文章来源:学术头条
刚刚,谷歌在大模型领域又有了新动作:重磅推出了一系列轻量级、先进的开放模型 Gemma。
据介绍,Gemma 由 Google DeepMind 和 Google 的其他团队共同开发,采用与创建 Gemini 模型相同的研究和技术构建而成,专为负责任的人工智能开发而设计,其名字来自拉丁语 gemma,意为“宝石”。
Google DeepMind 首席执行官 Demis Hassabis 在 X 上表示,“我们长期以来一直支持负责任的开源和科学,这可以推动快速的研究进展,因此我们很自豪地发布了 Gemma......”
研究团队在 Google DeepMind 官方博客中公布了一些关于 Gemma 的关键细节,如下:
同尺寸下最强
据官方博客介绍,Gemma 模型与 Gemini 共享技术和基础设施组件,这使得 Gemma 2B 和 7B 与其他开放模型相比,在其规模上实现了同类最佳的性能。而且,Gemma 模型能够直接在开发人员的笔记本电脑或台式电脑上运行。
值得一提的是,Gemma 在关键基准上超过了更大的模型,同时还符合谷歌严格的安全和负责任的输出标准。
此外,为了使 Gemma 预训练模型安全可靠,谷歌使用自动化技术从训练集中过滤掉某些个人信息和其他敏感数据;还使用了大量的微调和基于人类反馈的强化学习(RLHF),从而使 Gemma 的指令微调模型与负责任的行为保持一致;为了解并降低 Gemma 模型的风险,谷歌进行了严格的评估,包括人工红队、自动对抗测试和危险活动模型能力评估。
跨框架、工具和硬件优化
谷歌方面表示,为适应特定的应用需求,比如汇总或检索增强生成(RAG),开发者可以使用自己的数据对 Gemma 模型进行微调。
目前,Gemma 支持多种工具和系统:
参考链接:
https://blog.google/technology/developers/gemma-open-models/
技术报告链接:
https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf
来源:学术头条
发布人:暖色
声明:该文观点仅代表作者本人,不代表火讯财经立场。火讯财经系信息发布平台,仅提供信息存储空间服务。
如文章涉及侵权, 请及时致函告之,本站将第⼀时间删除⽂章。邮箱:840034348@qq.com