生命科学领域实现突破须与信息技术深度融合
| 来源:中国科学报【字号:大 中 小】
人体是一个网络化开放式的复杂巨系统,具有高智能、自组织、自调节、自稳态等特征,通过能量信息传递进行新陈代谢,自我更新、自我修复、自行运动、自我繁衍。对人的生命活动本质规律的揭示应该是现代科学技术交叉融合的主攻方向。
就生命科学领域而言,需要揭示三大基本科学问题:解析组成生命体的微观结构,探索结构之间的关联关系,揭示结构及其功能的时相性变化规律。生命活动的本质从以还原论为代表的微观角度理解,是蛋白质及其他生物大分子的同化作用和异化作用的对立统一运动过程,以生物大分子自我更新、自我复制、自我调节为机制;从宏观角度理解,是维系人体生命活动的结构系统在演变中所表征的高智能、自组织、自调节、自稳态,新陈代谢、自我修复、自我繁衍的过程,维系机制是能量信息的网络化传递。
笔者认为,生命科学研究应该是还原论、整体论、信息科学三者的深度融合,以基因组学、蛋白质组学、代谢组学、微生物组学、单细胞图谱刻画等为代表的生命科学技术,从超微观的分子、微观的生物大分子、亚细胞、细胞、细胞间联系到组织、器官、系统和整体等多个层面,系统解析人体结构,探索结构间的关联关系,系统研究组织器官细胞的精细结构及其功能的时空变化,获取海量的生命活动数据知识,并转化为数学模型,模拟、复现或再现相关生命活动过程,系统解密生命活动的本质。这是生命科学技术发展的方向和追求的目标。医学科学与以大数据、物联网、人工智能和量子计算为代表的信息技术深度融合,是促进生命科学进步的必然途径。
生命科学的困境
现代科学技术解决了生命科学领域的部分难题,人类健康维护有了明显进步,疾病谱发生了改变。但是,由于至今尚未从整体上系统揭示人类生命活动的本质和规律,使我们在健康领域仍然处于有些老病未解、新病不断出现的窘境。主要表现在以下方面。
一是现代医学进步缓慢。后基因组时代,现代医学对疾病的认知和治疗并没有本质上的突破,比如沃森在2013年甚至宣称:多少年来想通过基因序列治疗癌症和其他疾病是“没价值的”。过度依赖基因层面的治疗选项,对某些疾病的治疗总体上很可能是退步了,而且增加了很多费用。
二是生命科学研究缺乏公理体系和数学计算。现代自然科学是建立在受控实验所得到的公理之上,关键在于逻辑化和公理化;医学研究是建立在结构学、功能学和生物实验观察之上,这些观察结果未能实现数理逻辑上的公理化。数学家在生物学中取得的成功远不及在物理化学方面,没有形成计算医学的研究范式,DNA螺旋依然只能观测一些二维现象,还未能系统揭示三维、四维的内在分子互作关系上的数理逻辑机制。
三是一些新方法运用不能从根本上促进医学进步。人类医学仍然停留在传统时代,依然在用天然的和化学的物质去对抗治疗疾病,对整体生命活动改善有限;外科手术演变成微创治疗,但微创仍是外科手术的一种,这种技术的“发展”是以丢掉组织为代价来治疗疾病的。而现代的互联网医学、人工智能医学只是信息技术本身的进步与拓展,还没有实现医学与信息科学的真正融合,形成相互促进式的发展。
需揭示的三大问题
一是解析人体微观结构。细胞是生命体的核心单元,人体是一个由约37万亿~40万亿个细胞构成的复杂系统。目前微流控细胞分离、单细胞DNA/RNA测序、细胞原位分析、质谱流式细胞分析等技术已经逐渐建立并用于单细胞分析。单细胞检测技术会产生包括DNA序列、RNA序列蛋白质等生物分子组成,以及它们的细胞空间位置等海量数据,应对这些数据进行分析, 用生物信息学方法从中筛选出有用的信息来建立细胞结构图谱数据库。如通过目前的形态表征差异来区分不同的细胞,推测人体的细胞类型可能有200到300种不等,但如果用单细胞图谱刻画技术,可能会发现有上万种类型的细胞。
二是探索结构之间的关联关系。转录水平本身在许多情况下不足以用来预测蛋白质表达水平以及解释基因型与表型的关系。以复杂系统科学的整体论作为方法论,探索在生物分子、细胞、组织、器官等多个层级结构之间相互作用中“涌现”出的新属性,系统探索它们之间的关联关系,有利于提升从微观层面系统认知健康与疾病的特征,研发具有多靶性系统性调节和干预的新药。
三是揭示结构及其功能的时相性变化规律。自然界任何物质都是在不断演变的,人体从受精卵形成时起到生命活动结束,所有组织结构及其功能无不发生时相性的变化。揭示随时间变化的生物大分子变构及细胞状态特征、瞬时属性、细胞数量等信息,以及不同健康状况、不同基因型、不同生活方式和生活环境下的生物大分子变构及细胞状态结构的动态变化规律,是认知生命活动规律的方法和路径。采用密集数据驱动的科学范式,挖掘隐藏于高维、高通量多维融合的生物医学大数据中的新洞见,将生物医学领域的知识模型转换为数学模型,以生物医学大数据作为输入参数,以人工智能算法对模型进行迭代、训练,输出旨在揭示逼近于真实的生命系统结构与功能的时相变化表征。
新的方法论及其科学意义
生命科学研究的方法论是解析生命体微观系统性、复原宏观整体性。人体经络可能是能量信息流纵横交错、由表及里的网络化传输模式。维系机体生命活动的能量信息由表及里地传递于各系统间、器官间、组织间、细胞间、亚细胞结构间。能量信息还与体外环境、体表体腔微生态环境进行实时沟通交换。经络的载体形式可能是:细胞骨架、细胞膜、细胞间链接、组织内及组织间结缔组织,这种网络化的物理结构可能是信息能量的传递通道(信道)。
人体的这种能量信息网络(经络)用现代物理及信息技术应该能够实现可视化。
刻画人体能量信息网络传递机制的三大工具为生命大数据、数学模型、人工智能。
生命科学大数据将是揭秘生命活动本质的基础,将是人类有史以来数据结构最复杂、规模最庞大、内容最丰富的科学大数据。
数学模型是庞杂生命科学大数据数学定量分析和集成的基础,依据人体生命科学大数据构建的数学模型,有可能揭秘生命科学大数据背后生命活动规律的数理逻辑表达,有效模拟、再现或复现微观和宏观生命活动过程,重构生命体四维结构,揭示结构之间的关联关系和时相性变化规律,以及物质、能量与信息转化形式。
通过人工智能,自动化自适应构建数字人体模型,以定性定量定位描述生命活动的状态、健康水平、疾病程度及治疗效果和转归。
对人体生命系统网络解析的科学意义包括以下几个方面。
一是改变生命科学实验模式。它可能会改变生命科学的实验研究范式,能减少实验动物的使用,用数字疾病模型替代动物疾病模型。
二是全球合作共享。关系人类生存、健康和可持续发展的重要科学进展能推动全球生命科学领域的交流合作。
三是全面认知生命。把局部生命物质运动和演化现象,放到人体生命系统网络的体系中去评价,对精确诊断及治疗、维护人类身心健康有极大价值和意义。
四是促进互联网技术仿生学发展和科学技术全面进步。人体生命系统网络解析为人工互联网技术发展提供了仿生学基础。人体能量信息网络有可能是最科学、最智能、自组织性最高的网络模式。人体生命系统网络解析成果可以引领其他科学技术的快速发展,促进化学、物理学、信息科学、制造业、农业、数学等科学技术领域的全面进步。(作者:丛斌)