美艾伦AI研究所发布Olmo 3系列AI模型
| 来源:【字号:大 中 小】
2025年11月20日,美国非营利组织艾伦AI研究所(Ai2)发布了一系列“完全开放”的AI模型,公布了其训练数据和流程。
Ai2最新的Olmo 3系列模型包括三个版本,其中Olmo 3-Instruct参数为7B,专为指令跟随、多轮对话和工具使用进行优化;Olmo 3-Base提供7B和32B两种参数,适用于编程、理解、数学运算和长文本推理,特别适合进行预训练或微调;而Olmo 3-Think同样提供7B和32B两种参数,公开了9.3万亿训练令牌的语料库,是面向高级研究的旗舰推理模型。
Olmo 3提供了透明的训练过程和相关工具(如Dolma 3语料库和OlmoTrace),全面开放了从预训练到后训练的整个开发过程,包括训练数据、检查点和工具,支持推理、指令跟随和强化学习等任务,从而增强了用户的信任。
在各项基准测试中,Olmo 3家族表现出色,在数学和推理测试中,32B级别的Olmo 3-Think与其他开源模型如Qwen 3和Gemma 3相比表现持平或更优,而7B参数级别的Olmo 3-Instruct在指令跟随、函数调用和聊天任务中表现尤为出色。Ai2特别强调,这些模型在处理扩展上下文时仍能保持高质量,能够支持需要数万个令牌的推理应用。
信息来源:
https://allenai.org/blog/olmo3
