酵母转录因子结合位点保守性的生物信息学分析

时间:2022-02-21 11:41:41

酵母转录因子结合位点保守性的生物信息学分析

【摘要】目的:本研究拟发掘出酵母基因组中转录因子结合位点的保守性位点和规律。方法:本研究采用生物信息学中保守性模体参数Mi分析基因上游不同区域与真核生物转录因子结合位点保守性之间的关系。结果:转录因子Sok2、Swi4结合位点的保守性在基因转录起始位点上游各个区间的差异主要由其本身的序列特性决定。此外,本研究分别发掘出转录因子Sok2、Swi4结合位点的保守性位点。结论:本研究结果有助于提供新的参数用以改进现有预测转录因子结合位点的方法,在此基础上为深入研究真核生物的转录水平调控模式奠定理论基础。

【关键词】酵母; 转录因子; 结合位点;保守性;生物信息学

真核基因的表达调控可在多个层次上进行,但主要表现在对基因转录活性的调控上[1]。转录因子与对应DNA序列结合调控其目标靶基因的表达是基因表达调控的核心问题,因此转录水平的调控是真核基因表达最基本的调控方式[2]。转录因子不但可以结合在DNA序列上调控基因转录的起始,同时也可以招募组蛋白修饰酶,对转录因子结合位点附近的组蛋白进行修饰,而组蛋白修饰又可以促进DNA与转录因子的结合,还可能产生新的转录因子结合位点。正是由于不同发育阶段特异、细胞特异的反式作用因子与相应DNA调节元件的结合,导致了基因的差异表达[3]。

本研究以真核模式生物酵母的转录因子为研究材料,从酵母基因组的数据库SGD里提取转录因子结合位点的数据。研究结果将为为更加准确的预测真核生物转录因子结合位点提供数据支持,并且为更深入的解析真核生物转录调控网络奠定理论基础。

1材料与方法

1.1通过SGD数据库获得结合位点数据

酵母基因组数据库SGD 是已经完成基因组全序列测定的啤酒酵母基因组数据库, 包括啤酒酵母的分子生物学及遗传学等大量信息。从文献所报道的117个转录因子及其所调节的基因中,选取转录因子调控基因数目最多的两个转录因子Sok2、Swi4,研究其结合位点保守性。

1.2一致性序列选取

转录因子的一致性序列分别确定为:Sok2 TGCAGNNA(SGD);Gcn4 TGACTCA(TRANSFAC);对于转录因子Swi4有特殊处理,因为其常见结合一致性序列为CAAGAAAA和CGCSAAA(SGD),并且SGD数据里所给转录因子Swi4在TSS上游的结合位点为九位。

1.3转录因子结合位点保守性分析

1.3.1位置权重矩阵

1.3.1位置权重矩阵

本研究根据位置权重矩阵的思想,利用matlab 7.0 编写程序对所选取的每个转录因子所有结合位点实例片段进行不加入空位的比对,统计每个位点上四个碱基出现的频数。根据矩阵模型的原则,构建位置频率矩阵,再通过转换构建位置概率矩阵,最终构建位置权重矩阵。给定已知的N条转录因子结合位点,构建矩阵的目的就是要求所建的矩阵能够很好地区分出真正的转录因子结合位点序列和非转录因子结合位点序列,因此需要对构建的矩阵模型中的矩阵元进行权重。将位置概率矩阵PPM进行变换,构建位置权重矩阵(position-specific weight matrix) PWM:

1.3.2 转录因子结合位点的保守性统计

根据研究需要本研究改进了参量的数据,引入新的参量fib,以四种碱基在啤酒酵母基因中出现的实际频率作为P0b背景序列碱基出现的概率,对转录因子结合位点单个位点碱基保守性的参量进行修改,保守性的定义如下

M=■■方程(1-1)中fib是N条转录因子结合位点序列中碱基b在位置i中出现的实际频数,当某一位点碱基随机选取时,则每一种碱基b出现的频率应该为fib/N,碱基b的背景频率为P0b,fib/N-P0b是此位点某一碱基频率与随机选取这一碱基频率的差值。

2结果

2.1 转录因子在基因上游不同区域位置权重矩阵结果分析四个转录因子在TSS上游不同区间的位置权重矩阵用一致性序列打分的结果分析:S值(权重矩阵打分结果)并没有随距离的增加有明显规律变化。转录因子Cbf1与Swi4的S值都在TSS上游200~300 bp取最高值,而Gcn4在TSS上游100~200 bp取最高值。其中除Sok2,其它转录因子在TSS上游800 bp结合位点由于样本过小,均小于5,这些区域的S值可信度较低,所以省略不计。

2.2 Sok2 保守性分析结果通过对数据库SGD的搜索统计发现转录因子Sok2集中分布在基因上游200~1400 bp,(其它区域结合位点数都小于5,所以忽略不计)。统计Sok2结合的八个位点在基因上游不同区域保守性变化。

2.3 Swi4 保守性分析结果通过对数据库SGD的搜索统计发现转录因子Swi4 结合位点集中在TSS上游100~900 bp(其它区域结合位点数都小于5,所以忽略不计)。统计Swi4 结合的七个位点在基因上游不同区域位点的保守性变化。

3讨论

Hippel认为,同一转录因子结合位点在序列组成上常常会存在差异,例如某些位置的碱基发生了替换,而这种替换的发生有时并不影响结合位点与转录因子的识别或结结合。转录因子与DNA序列的特异性结合主要是序列间氢键的相互作用[4]。本研究结果显示:转录因子Sok2、Swi4的结合位点都有替换的发生,但结合位点中每个位点的保守性存在差异。保守性较低的位点,在基因上游各个区间保守性都相对较低,在基因上游各个区间的保守性分布较大,偶有较大的值出现如Sok2[5]。然而,转录因子结合位点中存在非常保守的位点,一旦这些位点发生替换,就会极大的降低转录因子与结合位点的亲和力。本研究发掘出两个转录因子Sok2、Swi4结合位点的保守性最强的位点。这些位点在与其专属的转录因子的识别和结合过程中必定发挥着非常重要的作用。

综上所述,本研究采用生物信息学中保守性模体方法对酵母中两种转录因子的保守性进行分析。本研究结果能够极大提高酵母中转录因子结合位点预测的准确性,为深入研究真核生物转录因子与其结合位点的协同进化、及真核生物的转录水平调控模式奠定理论基础。

参考文献

[1] Guarente L, McDonogh O B. Conservation and evolution of transcriptional mechanisms in eukaryotes [J]. TrendsGenet, 1992, 8:27-32.

[2]Winston F. Control of eukaryotic transcription elongation [J]. Genome Biol.?2001, 2:2

[3]Kornberg R D. The molecular basis of eukaryotic transcription [J]. PNAS, 2007, 104 (32): 12955-12961

[4]Goodrich J A and Kugel J F. Genome-wide insights into eukaryotic transcriptional control[J]. Genome Biol, 2010, 11:305

[5]Casamassimia A and NapoliMediator C. complexes and eukaryotic transcription regulation[J]. Biochimie, 2007, 89(12): 1439-1446

作者简介:

沈霞,女,(1979-),陕西西安人,博士,讲师,研究方向:生物信息学

基金项目:国家自然科学基金(NO:81072731)

图 1 转录因子Sok2 结合位点保守性变化

图 2 转录因子Swi4 结合位点保守性变化

上一篇:内固定手术治疗脊柱化脓性感染的临床分析 下一篇:国产奥氮平与帕利哌酮治疗精神分裂症的疗效观...