数字技术与基础设施

日本发布大语言模型 实现了完全基于CPU的AI学习

日期:2024-07-18

|  来源:【字号:

东京工业大学、日本理化学研究所及富士通公司等近日宣布,利用超级计算机“富岳”开发的大语言模型“Fugaku-LLM”正式发布。

Fugaku-LLM”是首个完全基于日本国产技术构建的AI语言模型,其在处理日语及相关文化内容上表现卓越。模型特别擅长基于日语敬语进行自然对话。

面对全球范围内用于大语言模型计算的GPU短缺现状,此次研究团队选择使用富士通制造的CPU。通过提升“富岳”的计算能力,研究团队成功实现了完全基于CPUAI学习。

Fugaku-LLM130亿个参数,比日本广泛开发的70亿个参数模型要大。“Fugaku-LLM”目前已向全球研究者和技术人员开放,以鼓励更多的专业人士参与到模型的进一步改进和新的应用研究中,推动更多创新性研究和商业应用的发展。随着该模型的推广,预计将加速推动AI技术在各行各业的应用,尤其是在需要深度理解并运用日语的领域。

普通公众可在富士通的官网上免费下载并体验这一技术。这种开放的策略有助于提高公众对AI技术的理解和接受度,同时也可促进技术的广泛应用与可持续发展。

信息来源:

https://www.titech.ac.jp/english/news/2024/069223

http://digitalpaper.stdaily.com/http_www.kjrb.com/kjrb/html/2024-05/15/content_571496.htm?div=-1


附件: