上集视频介绍了DNA的复制性和突变性,DNA数据经过了自然选择才能进化成遗传信息。这一集分析DNA的操控性,DNA通过控制蛋白质的合成,控制生物的生长发育等活动,从而形成生命的系统。
生物与非生物的区别是有无生命,生命的分子生物学定义是:生命是由核酸和蛋白质相互作用产生的,从环境中获取物质、信息和能量以维持自身平衡的复杂系统。DNA通过操控蛋白质的合成来控制生物的功能和表型,生产每个蛋白质所需的DNA序列称为基因,基因是遗传信息的基本单位。
基因变成蛋白质要经过转录和翻译两个步骤,从DNA上拷贝基因遗传信息的过程叫转录,按照遗传信息合成蛋白质的过程叫翻译。所有的生物从DNA到蛋白质都共用同一套转录翻译体系,称为中心法则。
基因由编码区和非编码区组成,编码区是翻译成蛋白质的DNA序列,从起始密码子开始到终止密码子结束,是基因的功能单位。非编码区是转录调控相关的DNA序列,是控制基因的开关,包括位于编码区上游启动基因转录的启动子,位于编码区下游终止转录的终止子;还有一些能与特定的信息分子结合,调控基因表达的DNA序列,比如增强转录的增强子,抑制转录的沉默子等。基因的转录和翻译都有明确的起点和终点,基因的表达受到严格的控制。
细胞中表达的基因分为两类:⑴一类是维持细胞基本生命活动所必须,称管家基因,以组成型方式在所有细胞中表达,表达产物为结构蛋白,结构蛋白能维持机体的形态,是构成生物体的重要成分。另一类是奢侈基因,只在特定的细胞中表达,对细胞分化有重要影响,奢侈基因的表达产物通常为功能蛋白,比如催化蛋白、运输蛋白、免疫蛋白,这类基因与各类细胞的特殊性有直接的关系,比如肌肉细胞的肌动蛋白、红细胞的血红蛋白等。这些基因的特异表达决定了生物的发育、分化、衰老。正常细胞中只有5%的基因处于转录活性状态,大多数基因处于不表达的关闭状态。
原核生物主要通过转录调控基因的表达,原核生物的细胞和外界环境直接接触,环境因子往往是调控的诱导物,能开启或关闭某些基因的表达。在大肠杆菌中负责乳糖的分解的一组基因称为乳糖操纵子,当培养基中没有乳糖存在时,调节基因合成阻遏蛋白,结合于乳糖操纵子调控区域,乳糖基因被抑制,不能合成乳糖分解的三种酶;
当环境中有乳糖存在时,乳糖和阻遏蛋白结合,阻遏蛋白失去阻遏作用,乳糖操纵子被诱导开放合成分解乳糖的三种酶。乳糖被分解后,又造成了阻遏蛋白与调控区域结合,使乳糖基因关闭。乳糖操纵子的这种调控机制称为可诱导的负调控。
与原核生物的转录调控相比,真核生物的转录和翻译两个过程分别在细胞核和细胞质中进行,基因表达调控具有更多的层次性,从染色质结构,转录和翻译等过程中都有复杂的调控机制。基因在时间、空间上有序表达,决定了真核生物的生长,发育和分化,并能对环境的刺激作出反应,形成复杂的基因表达调控网络。
罗伯特·维纳于1948年发表了《控制论: 动物和机器中的控制与交流》,该书是控制论诞生的标志。就像生物根据周围环境的变化自行调整基因的表达,控制论是研究系统在变化的环境条件下如何保持平衡状态的科学。我国著名科学家钱学森将控制理论应用于工程实践,于1954年出版了《工程控制论》。生物控制论、工程控制论、经济控制论和社会控制论之间存在着类比关系,控制论的思想和方法已经渗透到几乎所有的自然科学和社会科学领域。控制论、信息论和系统论,被称为三论,是现代高新科技发展和创新的理论基础。
控制论首先需要明确系统的输入和输出,输入和输出可以是信息,比如生物感知外界环境信息的过程称为输入,按一定模式进行处理,产生相应的生物行为反作用于外界称为输出。其次根据系统的输入输出变量,找出它们之间存在的函数关系,建立系统模型,进行信息的变换和处理。
建立模型的关键是反馈,当遇到复杂的环境条件时,系统往往不能直接推导出准确的模型,而必须利用输入和输出数据做反向推演,即通过测量当前的输出,把它与预期值相比较,当两者存在偏差时,需要重新计算并求出控制信号,驱动输出向期望值运动。根据反馈对输出影响的性质,可分为正反馈和负反馈,前者增强系统的输出;后者减弱系统的输出。在基因的表达调控中,激活蛋白是激活转录的正调控,阻遏蛋白是沉默转录的负调控。
系统控制的关键是在变化环境的条件下,根据信息与反馈建立模型,根据输入进行合理的输出,从而维持系统的平衡。生物是DNA为适应环境而建立的模型,信息和反馈是生物进化的基础,信息来源于DNA复制和变异产生的数据,反馈来自于生物进化的物竞天择,适者生存,淘汰不适应环境的生物个体,保留适应环境的生物个体,实现物种的优化。1975,霍兰德用数学计算的方法模拟了生物进化的过程,提出了遗传算法,遗传算法是一种搜索最优解的计算模型,已被广泛地应用于信号处理、机器学习和人工智能等领域。
生物的表型,是DNA通过转录和翻译,控制蛋白质的合成所表现出来的,如果把基因到表型的对应关系看做输出函数,有些基因和表型是单基因控制的、线性传递关系,有些基因与表型是非线性传递关系,存在多对基因控制一个表型,和一对基因控制多个表型的情形,基因和表型对应的输出函数远比我们想象的复杂。如果基因比作象棋中的棋子,车马炮等每个棋子都有不同的功能和走棋规则,DNA存储的不仅是棋子一样的基因,还包括像深蓝电脑或阿尔法狗一样的智能程序,能根据环境的刺激,开关特定基因的表达,生物才能实现与环境对弈的功能。
在生物诞生之后的35亿年,地球的环境发生过沧海桑田、翻天覆地的变化,经历过冰雪覆盖、火山爆发、小行星撞击等各种大事件,但生物至今在地球上繁衍生息,蓬勃发展,在与恶劣的生存环境对弈过程中,DNA操控的生物始终屹立不倒,胜天半子。
总之,DNA的稳定性和存储性是物质基础,DNA的复制性、突变性是信息基础,DNA的操控性是控制和反馈的基础,五种性质共同成为构建生物模型的最底层架构。