数字技术与基础设施

中国科学院发布基于内生复杂性的类脑脉冲大模型

日期:2025-09-25

|  来源:【字号:

据中国科学院自动化研究所202596日消息,中国科学院自动化研究所李国齐、徐波团队与沐曦MetaX合作,打造了类脑脉冲大模型“瞬悉1.0”(SpikingBrain-1.0),在国产千卡GPU算力平台上完成全流程训练和推理,实现了大模型在超长序列推理上数量级的效率和速度提升,展示了构建国产自主可控的新型非Transformer大模型架构生态的可行性。研究团队开源了SpikingBrain-1.0-7B模型并开放SpikingBrain-1.0-76B测试网址,同步公开了经工业界大规模验证的类脑脉冲大模型SpikingBrain-1.0中英文技术报告。

与前主流大模型架构(Transformer架构)不同,“瞬悉1.0”借鉴大脑神经元内部工作机制,清晰地展示了一条不断提升模型复杂度和性能的新型可行路径。该模型仅需约主流模型2%的数据量,就能在多项语言理解和推理任务中达到媲美众多主流模型的性能。

据悉,这是我国首次提出大规模类脑线性基础模型架构,并首次在国产GPU算力集群上构建类脑脉冲大模型的训练和推理框架。其超长序列处理能力在法律/医学文档分析、复杂多智能体模拟、高能粒子物理实验、DNA序列分析、分子动力学轨迹等超长序列任务建模场景中具有显著的潜在效率优势。本次发布的大模型为新一代AI发展提供了非Transformer架构的新技术路线,并将启迪更低功耗的下一代神经形态计算理论和芯片设计。

信息来源:

http://www.ia.cas.cn/kxyj/kydt_1/202509/t20250908_7963201.html

http://cn.chinagate.cn/news/2025-09/08/content_118066805.shtml


附件: