sRNA发现研究方法

时间:2022-10-21 09:48:02

sRNA发现研究方法

引 言

小 RNAs 是一类大小在 50~500 nt 之间的调控 RNA,广泛存在于真核和原核生物中,在细胞生长过程中发挥着重要的生物学功能[1],随着第一个 sRNA (microRNA) 在线虫中被发现[2],近年来对sRNA的研究不断深入,在细菌中也发现存在着大量类似的 sRNA。由于sRNA不受移码和无义突变的影响,因此,sRNA 很难被检测到[3]。在初期,sRNA 主要是通过总 RNA 放射标记的方法 (如 4.5S、6S、tmRNA 和 RNase P 等)[4~6]、免疫共沉淀方法(如RsmZ和 CsrB 等)[7,8],或者遗传分析偶然发现的(如 MicF 和 DsrA 等)[9,10]。随着生物信息学和分子生物学的发展,以及大量细菌基因组测序的完成,多种用于系统地发现和研究sRNA的方法被提出,它们主要包括:计算机预测、微阵列直接发现、RNA 组学 (鸟枪克隆方法)及免疫共沉淀和SELEX 等方法。本文将就 sRNA 的发现及相关的研究方法进行综述,阐述各种方法的优缺点,并讨论今后的发展方向。

sRNA 的预测

持续增长的细菌基因组序列及越来越多的 sRNA 被发现,为在全基因组内进行 sRNA的计算机预测奠定了基础。常用的方法主要是通过寻找 sRNA 的各种特征来预测新的sRNA,然后通过在不同时间点或者不同生长条件下分离总的 RNA,用 Northern blotting 来验证预测的sRNA。王立贵等人[11]将目前的sRNA 预测方法主要分为三类,分别是比较基因组学方法、转录单元预测方法和机器学习方法。比较基因组学方法基于sRNA 基因在相近物种的基因组中具有较高的序列保守性和结构保守性,通过已知的sRNA 基因寻找与之保守的 sRNA 基因。基于比较基因组学原理,由Rivas 等人开发了用于预测 sRNA 概率的模型 QRNA[12,13],运用该模型,Rivas 等人在大肠杆菌中预测了 275 条候选的 sRNA 基因片段,其中的 11 条序列被实验证实为新发现的sRNA。由于该方法是通过序列的保守性来预测新的 sRNA,因此,其不能识别一个物种的特有 sRNA[14]。转录单元预测方法是通过在基因间区寻找启动子、终止子或完整的转录本来识别新的sRNA,目前已知的大多数 sRNA 都是通过这种方法发现的,Argaman 等人[15]、Chen等人[16]、Livny等人[17]和 Sridhar 等人[18]基于该预测方法均已取得成功。该方法主要是通过在基因间区中寻找启动子和终止子的特征来预测新的 sRNA 基因,因此,该方法对预测没有明显启动子或终止子特征的sRNA显得无能为力;同时,由于目前预测终止子算法主要是针对ρ非依赖型终止子特征而设计的,因此,对具有ρ依赖型终止子的 sRNA 基因,该方法则无法进行有效预测。机器学习预测方法主要是根据sRNA 和非 sRNA 序列的特征变量不同,通过机器学习算法来预测新的 sRNA。Carter 等[19]运用神经网络机器学习方法构建的 sRNA 预测模型,细菌交叉检验的精度达到80%~90%;Saetrom 等[20]运用遗传算法预测sRNA 基因,结果经Northern blotting 实验验证,其中 12 条序列具有杂交信号。机器学习方法虽然在一定程度上克服了上述两种方法的一些缺点,但是该方法自身也有不足。由于目前被发现的 sRNA很少,应用目前为数不多的 sRNA 作为阳性训练集,并不能很好地反映 sRNA 的特点,因此,随着被发现的 sRNA 数量的不断增加,机器学习预测方法必定能够取得更大的成功。

sRNA的识别

DNA微阵列

DNA微阵列(DNA microarray)又称 DNA 阵列或 DNA 芯片,经由一次测验,即可提供大量基因序列相关信息。它是基因组学和遗传学研究的工具。微阵列的基本原理是通过样品中的靶基因与固定在芯片上的探针发生特异杂交,利用特定扫描仪获得杂交信号。微阵列大多用于 mRNA 表达分析,但是它也可以作为研究 sRNA 表达和发现的一种工具。然而,不同于 cDNA 微阵列,检测 sRNA 的探针设计 (寡聚核苷酸探针设计) 需要针对存在大量 sRNA 的基因间区,而高密度寡核苷酸探针适用于发现 3'- 或 5'-UTR 的 sRNA 片段[21,22]。研究人员应用基因芯片可以在同一时间内定量地分析大量基因的表达水平,因此,它具有快速、精确、低成本的生物分析检验能力。但是它在发现 sRNA 中存在一个主要缺点,就是杂交过程中需要大量靶基因样品,而大量靶基因样品的获得比较困难,这主要是由于在RNA反转录为 cDNA 的过程中,大多数 sRNA 长度在 100~150 nt 之间[24,25],造成反转录可能无效,并且其稳定的二级结构可能会阻碍寡核苷酸探针检测[21,23]。因此,通过合成的一定长度(如 20、30、70-mer 等) 的寡核苷酸单链探针,来代替全长 cDNA 点样、制成芯片,无需扩增,防止了扩增失败影响实验,也减少了非特异杂交,能有效区分具有同源序列的基因,同时,杂交温度均一、提高杂交效率。因此,寡核苷酸芯片的应用将会日益广泛。

RNA组学(鸟枪克隆法)

鸟枪克隆法起先是用来建立cDNA 文库,从而推导表达序列标签 (EST) 文库以发现mRNAs[26]。而 Vogel 等人[10]则利用鸟枪克隆法来发现 sRNA 基因。首先,他们提取在不同生长条件下的大肠杆菌总 RNA,并利用 PAGE 方法获得 50~500 nt 长度之间的 RNA[21],以此利用鸟枪克隆得到 sRNA 文库,在该文库中筛选符合条件的 sRNA 进行实验验证,最终新发现了 7 条 sRNA 基因。这种方法能够检测到不同培养条件下、一定长度范围内的所有sRNA,而不需要预先知道 sRNA 的特征,但是,由于需要对大量克隆进行测序,这种方法的价格比较昂贵;同时,由于 sRNA 的长度、或者结构的改变,很有可能使其不能完全反转录成 cDNA,这样 sRNA 文库就不能很好地反应出细菌所有的 sRNA[21,27]。

免疫共沉淀和基因 SELEX

热稳定蛋白(a host factor for RNA phage Qβ,hfq) 参与前 mRNA 的剪切和 RNA 复合物的降解,hfq 与 RNA 的相互作用对于多种调控过程来说都非常重要,目前实验证实,许多 sRNA 都与 hfq 结合来发挥调控作用,因此,通过芯片检测与 hfq 共免疫沉淀的sRNA,并在 hfq 突变菌株中观察其表达水平,是发现 sRNA 的一种有效手段。如大肠杆菌中的 CsrB 和荧光假单胞菌中的 RsmZ,就是分别通过与靶蛋白 CsrA 和 RsmA 的免疫共沉淀发现的[8,28]。SELEX (指数级富集配体系统进化技术)是一种寻找与其他分子相互作用的RNA 序列的方法。通过亲和层析筛选与靶分子作用的 RNA,然后将其转换成双链 DNA,并进行PCR 扩增。这个程序经过连续几轮扩增,与靶分子结合的 RNA 序列就被极大地富集了。Schroeder等人[29]利用 SELEX 方法,筛选出一段新的在大肠杆菌中与 hfq 蛋白结合的 sRNA。

sRNA的验证

Northern印迹

Northern印迹是利用带标记的 DNA 探针与 RNA 进行分子杂交来检测特异性 RNA 的技术。目前多数研究者将 Northern 印迹作为鉴定 sRNA 的金标准。但 Northern 印迹的最大缺点是对样品的需求较多,需要微克级样品才能避免假阴性,有时样品量达到40 ng才会出现明显的杂交信号,然而细菌的 sRNA 样品往往较难获得,从而导致易出现假阴性结果,并且其操作过程复杂,耗时较长,可能引起放射性核素污染。

实时定量PCR

实时定量 PCR 是基因定量表达的金标准[30,31],常用于蛋白编码基因表达检测,也被广泛地应用于 sRNA 的表达检测。与 Northern 印迹相比,PCR 方法可以高度灵敏地检测出低丰度表达的靶分子,并适于高通量筛选。它将纯化的小分子量 RNA 与特异的 sRNA 引物混合,经变性、复性过程使引物与模板配对;然后加入包含逆转录酶、底物及 RNA 酶抑制剂的混合物,逆转录生成cDNA;再以 cDNA 为模板,进行实时定量 PCR。其主要包括茎环引物荧光定量PCR、引物延伸 PCR 和加 poly (T)接头荧光定量 PCR[32]。与传统 PCR 相比,通过实时定量PCR 技术可以定量监测目的片段的表达情况并进行分析。

RACE

使用 RT-PCR 方法扩增目的片段时,一般很难得到全长的 cDNA 片段,而在研究中,获得基因的全长 cDNA 序列又十分重要。通过 RACE (cDNA 末端快速扩增技术) 可将缺失的 cDNA 两端补齐,但由于扩增 DNA 末端的特异性完全依赖锚定引物及扩增 DNA 模板样品的不均一性,因而特异性一般很低。随着生物学各项技术的交叉利用、对 RACE 技术的改良和发展、优化条件下 PCR 扩增效率和忠实度的提高,以及 PCR 产物克隆技术的进步,相信 RACE 技术在基因克隆及 RNA 剪接、基因家族和基因表达变化等多项领域研究中,将会表现出更大的应用价值。

总结和展望

本文系统地总结了 sRNA 的预测及实验验证方法,并指出了各种研究方法的优缺点,将为今后的 sRNA 研究工作提供一定帮助。众多预测方法在大肠杆菌中的应用表明,各种预测算法的敏感性和特异性都有待提高,同时,随着 sRNA 数量的逐步增加,机器学习预测算法将会有更广阔的应用前景。然而,在目前被预测的成百上千的 sRNA 基因中,只有很少一部分进行了实验验证,如果能出现高通量的sRNA实验验证手段,将会极大地推动sRNA的相关研究。我们相信,随着生物信息学和分子生物学实验技术的发展,以及对 RNA 分子特性的深入研究,越来越多的sRNA基因将被发现,这必将会加深人们对 sRNA 参与转录后加工及翻译调控等生命过程的认识。虽然目前只有很少的 sRNA 被发现并被阐明生物学功能,但是在已被证实有重要调控功能的sRNA中,其功能的多样性日益扩展。需要指出的是,虽然在霍乱弧菌、假单胞菌、葡萄球菌和李斯特菌等[33~38]中也开展了sRNA 研究工作,但目前对 sRNA 的研究主要集中在大肠杆菌中,因此,在其它细菌中系统地发现和注释 sRNA基因也是一个重要发展方向。目前的研究发现,在真核生物中存在具有重要调控作用的长非编码 RNA。如lincRNA-p21[39],它有效介导抑癌基因 P53 的表达。目前,在哺乳动物中有近 40 条[40]具有功能的长非编码 RNA 被发现,它们在生命活动中发挥着非常重要的调控作用。探讨在细菌中是否存在这种具有重要调控作用的长非编码 RNA,是研究细菌致病机理和耐药性的一个好的研究方向。总之,随着对非编码 RNA 的深入研究,将会有大量具有调控作用的 RNA 被发现,这必将推动人们对细菌致病机理的认识,并探讨重要非编码 RNA 作为潜在药物靶标的可能性,最终造福于人类。

上一篇:肝氧化损害与抗氧化保护对策研究 下一篇:电子商务人才培育的不足与策略