我国发布多模态推理大模型紫东太初4.0
| 来源:【字号:大 中 小】
2025年9月19日,中国科学院自动化研究所联合武汉AI研究院发布多模态推理大模型紫东太初4.0。自2021年首次推出以来,紫东太初已完成4次迭代,实现了从“纯文本思考”“简单操作带图思考”到“细粒度多模态语义思考”的跃迁,迈向多模态深度推理的新阶段。
紫东太初4.0引入了类人的交叉注意力机制,使模型能够像人一样,实现对世界的理解,从被动分析迈入主动思考的新阶段,具备边看、边识、边思的认知能力。
在视频理解中,该模型可精准处理180分钟长视频的片段定位与内容总结。在音频场景中,该模型能自动操作APP完成挂号等任务,并通过汽车、机器人实现实际操作。测评显示,该模型在六大关键能力维度及十六项国际权威基准测试中全面刷新纪录。
信息来源:
https://www.news.cn/tech/20251005/4f7fc59cec39411c865cf30cd226e8ac/c.html
https://www.cnr.cn/hubei/hydt/20250920/t20250920_527369156.shtml
