“十四五”网信专项

中国科学院物理研究所联合中国科学院计算机网络信息中心发布无机材料合成预测对话大模型MatChat

日期:2023-09-27

|  来源:【字号:

近年来,人工智能领域的一项重要进展是大模型的崛起,巨大的参数规模使得模型的学习能力和内容生成能力获得了飞跃式的提升。国内外各类通用大模型,如ChatGPT3.5、ChatGPT4.0、文心一言、讯飞星火等,引发了全球研究人员的极大关注。为了突出模型在特定领域的能力,研究人员采用了fine-tune的方式对预训练模型进行相关领域知识的微调,这种方法在医疗、金融、教育等领域已经取得了显著成效。

为实现模型在材料领域的应用,基于LLAMA2-7b,中国科学院物理研究所和中国科学院计算机网络信息中心共同合作,利用7万余条结构化材料知识数据进行学习和fine-tune训练,开发了材料领域大语言模型——CAS MatChat,该模型已初步具备了材料领域知识的生成推理能力。

CAS MatChat专注于化学合成,能够根据所询问的结构进行逻辑推理,并输出相应的制备工艺和配方。目前已经部署上线(http://chat.aicnic.cn/onchat),并向所有材料科研人员开放使用,为材料研究和创新带来了新启发和思路。相关代码已经在GitHub发布(https://github.com/materialsCnicCas/CASMatChat),后续会持续不断地完善和加强CAS MatChat的推理和生成能力。

该工作得到中国科学院网信专项(CAS-WX2023SF-0101)应用示范项目的支持。

中国科学院计算机网络信息中心人工智能技术与应用发展部供稿

附件: