谷歌推出最强开源大模型Gemma----中国科学院网信工作网

技术前沿与科研应用

谷歌推出最强开源大模型Gemma

日期：2024-03-25

| 来源：【字号：大中小】

2024年2月21日，美国谷歌公司宣布推出轻量级开源大语言模型Gemma。谷歌表示，Gemma采用与此前推出的Gemini模型相同的技术，由谷歌DeepMind团队开发，专为“负责任的AI”而打造，可在笔记本电脑、工作站或谷歌云上运行。

谷歌发布了20亿参数（Gemma-2B）和70亿参数（Gemma-7B）两个版本的Gemma模型。其中70亿参数的模型用于GPU和TPU上的高效部署和开发，20亿参数的模型用于CPU和端侧应用程序。不同的参数满足不同的计算限制、应用程序和开发人员要求。

谷歌声称，Gemma模型在语言理解、推理、数学等18项关键基准测试中，有11项测试分数超越了Meta Llama-2等更大参数的开源模型。平均分数方面，Gemma-7B模型的基准测试平均分高达56.4，远超过Llama-13B（52.2）、Mistral-7B（54.0），成为目前全球最强大的开源大语言模型。

信息来源：

https://blog.google/technology/developers/gemma-open-models/

https://mp.weixin.qq.com/s/_iCYfqmXA3enKn3Hm-DwSA

附件：