技术前沿与科研应用

谷歌推出最强开源大模型Gemma

日期:2024-03-25

|  来源:【字号:

2024221日,美国谷歌公司宣布推出轻量级开源大语言模型Gemma。谷歌表示,Gemma采用与此前推出的Gemini模型相同的技术,由谷歌DeepMind团队开发,专为“负责任的AI”而打造,可在笔记本电脑、工作站或谷歌云上运行。

谷歌发布了20亿参数(Gemma-2B)和70亿参数(Gemma-7B)两个版本的Gemma模型。其中70亿参数的模型用于GPUTPU上的高效部署和开发,20亿参数的模型用于CPU和端侧应用程序。不同的参数满足不同的计算限制、应用程序和开发人员要求。

谷歌声称,Gemma模型在语言理解、推理、数学等18项关键基准测试中,有11项测试分数超越了Meta Llama-2等更大参数的开源模型。平均分数方面,Gemma-7B模型的基准测试平均分高达56.4,远超过Llama-13B52.2)、Mistral-7B54.0),成为目前全球最强大的开源大语言模型。

信息来源:

https://blog.google/technology/developers/gemma-open-models/

https://mp.weixin.qq.com/s/_iCYfqmXA3enKn3Hm-DwSA


附件: