构建基因调控布尔网络及其动态分析

时间:2022-05-14 09:24:38

构建基因调控布尔网络及其动态分析

摘 要:利用互信息理论和布尔网络共同建立基因调控网络模型,并且通过举例说明该方法,用此方法相应地可推导出多个基因决定某个或多个基因的表达值的逻辑规则,根据得到的逻辑规则建立基因电路网络,再对得到的基因逻辑电路网络依据分析逻辑电路网络的方法建立基因调控网络动态转换,从而分析基因间的调控关系。

关键词:基因调控网络;熵互信息;布尔网络;反向工程

中图分类号:TP393文献标识码:B

文章编号:1004-373X(2008)07-151-03オ

Reconstructing Genetic Regulatory Boolean Network and Dynamic Analysis

WANG Liqin1,2,ZHANG Ling2,LI Jiangeng1

(1.College of Computer Science and Technology,Beijing University of Technology,Beijing,100022,China;

2.Zhangjiakou Vocational College of Technology,Zhangjiakou,075000,China)オ

Abstract:This article first uses the method to establish the gene regulationnetwork model together by mutually the information theory and the Boolean network,and through explains with examples this method,correspondingly may infer many genes with this method to decide some or many genes expression value logical rule,according to the logicalrule establishment gene electric network which obtains,again to genelogic circuit network basis analysis logic circuit network method establishment gene regulation network dynamic transformation,thus regulative relations between analysis gene.

Keywords:genetic regulatory network;mutual information of entropy;Boolean network;opposite direction engineering

1 引 言

基因网络的研究最初是在20世纪60年代,Rater 描述了控制原核生物的分子基因系统组织的特点。另一项研究是Kauffman通过简单的逻辑规则研究基因网络动力学,提出了简单布尔网络理论[1]。20世纪90年代实验数据的增加,更加加速了基因网络理论的研究。到目前为止已发展了很多研究基因网络的方法,如随机模型、布尔网络、逻辑方法、门限模型以及基于微分方程的方法等[2]。全基因组测序后展现在科学家面前的是浩瀚的DNA序列信息,这就要求人们要“读懂”他,也就是要了解基因是如何表达的,以及基因的表达是如何受到调控的,并在全基因组水平上系统阐述这些基因的表达调控规律,进而来揭示生命的奥秘。一个基因的表达受其他基因的影响,而这个基因又影响其他基因的表达,这种相互影响相互制约的关系构成了复杂的基因表达调控网络(gene regulatory networks)。从表达谱数据出发,可以建立基因或蛋白质相互作用的网络模型,这种方法也称反向工程(reverse engineering)[3]。全基因组基因表达调控网络的研究必将促进个性化医疗的发展和重大复杂疾病的预测和治疗,并最终揭示出人类生老病死的奥秘。关于基因表达调控网络目前人们做了很多研究,本文提出用熵互信息的数学理论寻求基因间关系的逻辑函数,有了基因之间的逻辑关系函数,就可以构建基因逻辑电路网络(gene logic circuit networks),再利用基因逻辑电路网络与逻辑函数得到基因在不同时间的基因状态,由得到的基因状态就可以画出基因调控网络的动态转换图,可以从基因调控网络的动态转换图中研究网络的变化,可以把此方法用在生物基因调控网络的分析和研究中,寻找变异基因网络与正常基因网络动态变化的差异,试图找到引起疾病的原因。本文提出一个新观点,基因网络可以分为抑制型和非抑制型两类。提出一个新方法用逻辑电路网络表示基因调控网络,把逻辑电路的分析方法用到基因网络的动态网络分析中。

2 利用熵确定基因调控布尔网络逻辑关系

要想构建基因调控布尔网络,关键是找到基因之间的布尔逻辑关系函数,现在关于确定基因调控关系也是后基因时代的一个研究热点,在这里考虑应用熵的互信息理论去寻找基因之间的逻辑关系函数。首先由基因表达序列(其中基因表达用1表示,基因不表达用0表示)根据下面所定义的公式得到熵与互信息熵,再由得到的熵与互信息熵确定基因之间的逻辑关系。

И

H(X)=-∑PXlog PX,H(Y)=-∑PYlog PY

H(X,Y)=-∑PX,Ylog PX,Y

M(X,Y)=H(X)+H(Y)-H(X,Y)

И

现在考虑三个基因X1,X2,X3У那榭觯利用熵互信息理论找到三个基因的逻辑关系函数,三个基因的基因表达序列(其中基因表达用1表示,基因不表达用0表示)如表1所示。

ケ1 基因表达序列

在表中X1,X2,X3为输入基因表达,X1′, X2′,X3′为输出基因表达,可以利用上面所提到的熵互信息公式得到基因X1,X2,X3,X3′的熵和互信息熵。

H(X1)=1.00,H(X2)=1.00,H(X3)=1.00,H(X1,X2)=2.00,H(X2,X3)=2.00,H(X1,X3)=2.00,H(X1,X2,X3)=3.00,H(X3′)=1.00

И

有了基因X1,X2,X3的熵和互信息熵,下面详细介绍寻找输入基因X1,X2,X3与输出基因X3′的逻辑关系过程:

H(X3′,X1)=1.81, M(X3′,X1)=0.19

M(X3′,X1)/H(X3′)=0.19

H(X3′,X2)=1.81, M(X3′,X2)=0.19

M(X3′,X2)/H(X3′)=0.19

H(X3′,X3)=1.81, M(X3′,X3)=0.19

M(X3′,X3)/H(X3′)=0.19

H(X3′,[X1,X2])=2.50, M(X3′,[X1,X2])=0.50

M(X3′,[X1,X2])/H(X3′)=0.50

H(X3′,[X2,X3])=2.50, M(X3′,[X2,X3])=0.50

M(X3′,[X2,X3])/H(X3′)=0.50

H(X3′,[X1,X3])=2.50, M(X3′,[X1,X3])=0.50

M(X3′,[X1,X3])/H(X3′)=0.50

H(X3′,[X1,X2,X3])=3.00

M(X3′,[X1,X2,X3])=1.00

M(X3′,[X1,X2,X3])/H(X3′)=1.00

И

由以上分析可以得到其逻辑关系为:

X3′=(X1 and X2)or(X2 and X3)or(X1 and X3)

И

由同样的方法可以得到:

И

X1′=X2

X2′=X1 or X3

И

其中:or为或逻辑,and为与逻辑。

上述介绍了用熵互信息理论找到基因之间逻辑关系的方法,通过用此方法编辑软件可以对多个基因进行处理,找到基因之间的逻辑关系函数。有了基因之间的逻辑关系函数就可以构建基因布尔网络,从而了解基因之间的关系。

3 基因布尔网络的分析

基因布尔网络[4,5]是一个有N个节点(基因),并且对每个节点如果给予i个输入(用二进制0或1表示)在任意时间t被定义为xi(t),当xi(t)=0时基因没有表达,xi(t)=1时基因被表达,全部输入在时间t的表达水平可以用行向量表示x(t)=[x1(t),x2(t),…xn(t)]В任一节点的输出依赖于所给定的布尔函数及其输入节点的布尔值。该网络类似一个被控制的布尔电路网络所有的节点。同时受输入和布尔函数决定,然后产生下一个状态。

对于基因调控的布尔网络从结构上应该认为可以有两种:基因网络分为抑制型和非抑制型两类。

抑制型 [HTSS]该基因网络表示为抑制型的(见图1)。这是一种特殊的基因布尔网络,每个基因只是单向传输的。对于这样的基因调控网络,可以用一个简单的逻辑电路网络来表示(见图2),从逻辑电路网络可以看到该网络有4个输入,1个输出。其中cdk7与cyclinlt是逻辑与,P21/WAF1是一个逻辑非,到最后Rb输出的是一个逻辑与非,到Rb输出时网络被抑制(2000年被Rzhetsky等提出)[6-8]。

图1 基因调控

非抑制型 [HTSS]该基因网络是未被抑制的,该基因网络在时间t+1的状态是由时间t提供的。假设一个三个基因的未被抑制型的布尔网络用逻辑电路网络来表示(见图3)。其中三个基因满足的逻辑关系可以用以下的逻辑关系函数式表示:

x1(t+1)=x2(t)

x2(t+1)=x1(t) or x3(t)

x3(t+1)[WB]=(x1(t) and x2(t)) or (x2(t) and x3(t)) or

图2 逻辑电路网络

图3 基因逻辑电路网络

表2 逻辑真值表

依据真值表里的状态可以绘制出逻辑状态转换图(见图4),进而就得到了基因调控网络的动态转换的过程。从得到的基因调控网络的动态转换的过程可以了解以下知识:

(1) 把系统经历部分状态,最后围绕一个反复出现的状态周而复始地进行的行为称为状态循环,在图4中010,100就是一个状态循环。

图4 基因调控网络动态转换

(2)倾向于状态循环,但又没有处于循环之中的状态称为暂态,如图4中001,101,011,110都属于暂态。

(3) 吸引子是系统被吸引并最终固定于某一状态的性态,在图4中111就是一个吸引子。

(4) 流向状态循环吸引子的状态加上状态循环合起来称之为吸引子的吸引盆,在图4中101到011到吸引子111,110到吸引子111就是一个吸引盆。如果吸引子的吸引盆区域越大,则说明吸引子有足够的影响力,该吸引盆网络的稳定性越强。

4 布尔基因调控网络的进一步研究

根据给出的方法得到布尔基因调控网络的逻辑关系函数,然后用得到的逻辑关系函数找到基因调控网络的动态变化过程,根据动态变化找到基因的变化。可以看到任何一个基因发生变化或任何一个状态发生变化,都会引起整个动态网络变化。可以把此方法用于生物基因网络的分析,可以利用通过比较正常基因网络动态变化与变异基因网络动态变化,在基因调控网络中找到引起疾病的原因。布尔基因调控网络在确定过程中有时受基因表达的不准确性,导致得到的逻辑关系有问题。逻辑关系出现问题,后边的逻辑状态转换过程有误,不容易得到准确的结论,对于疾病的研究会带来不准确性,再者基因调控网络是一个动态网络,本来就具有不确定性,所以为了更好地研究基因调控网络,进一步的研究工作是用概率布尔网络来解决基因调控网络的不确定性。

参 考 文 献

[1]Kauffman S A.The Large-seale Structure and Dynamics of Gene Control Circuits[J].Anensemble Approach.Theor.,44:167-190.

[2]雷耀山,史定华,王翼飞.基因调控网络的生物信息学研究[J].自然杂志,2004,26(1):7-12.

[3]王正华,王勇献.后基因组时代生物信息学的新进展[J].国防科技大学学报,2003,25(1):1-6.

[4]张国伟,邵世煌,张颖.布尔基因网络及其研究[J].东华大学学报:自然科学版,2006,32(2):127-130.

[5]Davidson E.A Genomic Regulation Network for Development[J].Science,2002,295:1 669-1 678.

[6]Shmulevich I,Dougherty E R,Kim S.Probabilistic Boolean Networks:A Rule-based Uncertainty Model for Gene Regulatory Networks[J].Bioinformatics,2002,18:261-274.

[7]Pal R.Generating Boolean Networks with a Pprescribed Attractor Structure[J].Bioinformatics,2005,21:4 021-4 025.

[8]Rzhetsky A,Koike T,Kalachikov S.A Knowledge Model for Analysis and Simulation of Regulatory Networks[J].Bioinformatics,2000,16:1 120-1 128.

作者简介

王丽琴 女,1973年出生,河北张家口人,硕士研究生,讲师。研究方向为生物信息学。

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。

上一篇:代码移交测试模型及其应用 下一篇:Canny算法在光子晶体光纤端面图像处理中的应用