炎症性肠病的基因共表达网络构建与分析

时间:2022-08-04 08:40:31

炎症性肠病的基因共表达网络构建与分析

[摘要] 目的 用共表_网络的系统生物学分析炎症性肠病(Inflammatory Bowel Disease,IBD)主要包括溃疡性结肠炎(Ulcerative colitis,UC)和克罗恩病(Crohn’s disease,CD)的生物学功能,为疾病机制研究和药物开发提供重要信息。 方法 本文以公共数据库中的212个IBD RNA-Seq数据为对象,用权重基因共表达分析(Weighted Gene Co-expression Network Analysis,WGCNA)方法构建其基因共表达网络,数据库注释、可视化和综合发现(Database for Annotation,Visualization and Integrated Discovery,DAVID)工具分析模块数据,并利用药物处理基因表达谱数据库(Connectivity map,CMAP),对可能的治疗药物进行筛选。 结果 (1)共鉴定出12个具有生物学意义的共表达基因模块,模块的功能与免疫应答、血管生成、转录、翻译、能量代谢等生物学过程相关,并挖掘出每个模块的关键节点基因;(2)发现UC和CD间在胺基糖代谢、O-Glycan合成、血管生成、B细胞受体信号通路上有显著差异;(3)挖掘出12种潜在治疗药物。 结论 本文首次鉴定出IBD基因功能模块,这些模块可能代表疾病的主要特征,为疾病机制研究和药物开发提供重要理论依据。

[关键词] 炎症性肠病;基因共表达网络;溃疡性结肠炎;克罗恩病

[中图分类号] R574.1;Q933 [文献标识码] A [文章编号] 1673-9701(2017)09-0035-04

Construction and analysis of gene co-expression network of inflammatory bowel disease

YE Hua1 LIU Huiwei2 HUANG Shiliang1 ZHANG Xuesong1 HUANG Sha1 GAO Zhiqiang1 LIU Wei3 SONG Yufei1

1.Department of Gastroenterology, Ningbo University Affiliated Ningbo Medical Center Li Huili Hospital, Ningbo 315040,China; 2.Ningbo University School of Medicine, Ningbo 315211, China; 3.School of Life Science, Fujian Agriculture and Forestry University, Fuzhou 350002, China

[Abstract] Objective To analyze inflammatory bowel disease(IBD) including Ulcerative colitis(UC) and Crohn's disease (CD) by using the systematic biology of co-expression networks,and to provide important information for disease mechanism research and drug development. Methods A total of 212 IBD RNA-Seq data in the public database were chosen as the study subjects. Construction of gene co-expression network was carried out by weighted gene co-expression network analysis (WGCNA) and the module data was analyzed by database for annotation, visualization and comprehensive discovery.The possible therapeutic drugs were screened using the drug-treated connectivity map (CMAP). Results (1) A total of 12 biologically significant cofactor gene modules were identified. The function of the module was related to the biological processes such as immune response, angiogenesis, transcription, translation and energy metabolism, and the key node gene of each module was excavated; (2)There were significant differences in amino acid metabolism, O-Glycan synthesis, angiogenesis, B cell receptor signaling pathway between UC and CD; (3)12 kinds of potential treatment drugs were excavated. Conclusion The IBD gene functional modules were identified for the first time. These modules may represent the main characteristics of the disease and provide important theoretical basis for disease mechanism research and drug development.

[Key words] Inflammatory bowel disease; Gene co-expression network; Ulcerative colitis; Crohn's disease

炎症性肠病(Inflammatory bowel disease,IBD)主要包括溃疡性结肠炎(Ulcerative colitis,UC)和克罗恩病(Crohn’s disease,CD),其发病机制尚未明确[1]。我国CD发病率超过0.03%,UC的发病率逐年上升[2,3]。IBD是多基因控制和环境影响共同作用导致的疾病,传统的单基因研究方法不能提供基因表达全景图,限制发病机制研究和有效药物开发。二代测序技术的发展,使得获得精确的基因表达数据成为可能,优于传统的基因芯片技术,为在系统水平研究IBD相关特征提供了支持。

使用谷歌学术等搜索引擎,发现应用基因共表达分析(Weighted Gene Co-expression Network Analysis,WGCNA)方法分析IBD二代测序数据的研究未见报道[4]。Costello等[5]对21个IBD样本进行差异分析,发现细胞增殖基因在UC上调,渗透及结构相关基因在CD上调,但未分析UC和CD间的差异;Granlund等[4]分析103个基因芯片数据,认为UC和CD间没有显著差异;Fang等[6]对公共数据库中儿童IBD及小鼠模型数据进行转录组分析,发现了一些共同的差异基因。最新研究发现,UC和CD间lncRNA的表达差异,其样本量也较少[7]。上述研究样本少,分析方法基于基因表达差异。本研究利用WGCNA的方法把上千个基因降维到若干个模块,首次构建IBD的基因共表达网络,将其模块化、简单化,这些模块代表IBD相关的生物学功能并利用大规模药物的基因表达谱数据CMAP,筛选可能的治疗IBD药物。

1 材料与方法

1.1 数据准备

从NCBI的GEO数据库下载(http://www.ncbi.nlm.nih.gov/geo)GSE57945数据集,共有212个GSM文件来自UC和CD患者纳入分析。数据来自Illumina HiSeq 2000测序平台的单端测序数据,利用TopHat进行比对,Avadis NGS软件进行定量(version 1.3.0,build 163982,Strand Scientific Intelligence Inc.)得到基因表达值(kilobase per million mapped reads,RPKM)。此数据用于后继的基因共表达网络构建。

1.2 共表达网络构建的参数设置

在R语言(Ver.3.2)下运行WGCNA包(Ver.1.51),进行基因共表达网络的构建与模块鉴定。为了获得有效的共表达网络,只选取表达值FPKM值大于5,且变异系数大于10%的基因进行网络构建,共6423个基因。基因共表达网络构建采用的参数如下:networkType=’signed’,softPower=12,minModuleSize =30,deepSplit=1.每个模块的稳定性以对212个样本数据进行1000次随机抽样106个样本,并计算随机抽样得到的模块基因连接度,抽样得到的连接度与原来的连接度进行相关分析,得到相关系数,抽样获得的1000个相关系数以均数±标准差(x±s)表示。

1.3 功能富集分析

共表达网络模块内各基因利用Database for Annotation,Visualization and Integrated Discovery(DAVID 6.7,https://david-d.ncifcrf.gov/)在线工具进行基因本体(Gene Ontology,GO)及京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析。在DAVID中,条目的富集程度定义为Benjamini校正后的Fisher精确检验P值。

1.4 药物表达谱分析

从Broad Institute CMAP下载药物处理细胞株的表达芯片数据,Affymetrix Expression Console软件分析,得到表达矩阵,将其映射到IBD共表达模块,得到模块的基因表达值ME(module eigengenes),根据ME值大小初步对可能的治疗IBD药物进行筛选。

2结果

2.1 成功构建炎症性肠病的基因共表达网络

本研究构建了炎症性肠病的基因共表达网络。WGCNA方法可以检测出14个稳定的共表达模块,每个模块内的基因具有相似的表达模式。为了证明这些模K具有稳定性,采用随机抽样的办法,对抽样前后每个模块内基因的连接度进行相关性分析,得到结果如表1所示。所有模块的基因连接度相关性均值大于0.9,稳定性最高的为模块14,最低的为模块7。

2.2 每个基因共表达模块执行不同的功能

为了解每个共表达模块对应的生物学功能,对其进行功能注释。利用在线分析工具DAVID,获取每个模块最为显著GO或KEGG注释条目(表2)。因此,炎症性肠病的共表达基因功能可以分解为这些相对独立的模块,几乎每个模块都和特定的生物学过程相关。比如,模块12和血管生成相关,其编码蛋白质主要分布于细胞外基质。模块14参与翻译,主要是细胞质中核糖体蛋白编码基因。

2.3 炎症性肠病节点基因

在网络中,处于中心位置的基因一般具有更为重要的功能。共表达网络中处于中心的基因具有高的连接度。基因的连接度越高表明该基因在模块中的重要性越大。通过连接度大小对基因的相对重要性排序,为实验验证基因功能提供信息。

2.4 共表达模块在克罗恩病和溃疡性结肠炎中的表达差异分析

利用WGCNA分析得到的每个模块的表达值,对12个共表达模块在炎症性肠病行了分析,发现有4个模块在克罗恩病和溃疡性结肠炎中存在差异(P

2.5 共表达模块可以用于治疗药物的发现

为了进一步验证这些共表达模块的重要性,使用药物处理细胞系的基因芯片数据进行分析,得到每个模块在不同药物处理中的表达值,根据表达值大小可以进行排序,筛选潜在的治疗药物。

3 讨论

WGCNA已经被多个研究证明是有效的基因共表达网络构建方法,大量文献无法一一列举[8]。其应用于人脑转录组分析,发现对应于不同脑区域的共表达模块[9]。肿瘤中,WGCNA分析鉴定到了所有肿瘤细胞株保守的基因表达模块,并具有临床意义[10]。本文也采用该方法,对IBD二代测序转录组数据分析,获得了14个基因共表达模块,其中12个模块具有明确和显著的生物学功能。传统的基因芯片分析方法一般是寻找差异基因,或者多组数据进行ANOVA分析;当实验数据成千上万时,实验条件也是千差万别,使得人们难以入手分析;而WGCNA方法可降维数据,把上千个基因浓缩为数十个有用的模块信息,弥补了常规分析方法的缺陷[11]。此外,获得的模块基因连接度信息可以为后继实验研究的候选基因筛选提供重要性信息,一个模块中的高连接度基因往往发挥更为重要的作用[12]。本研究为实验研究者提供了重要信息。

本文鉴定到的14个共表达基因模块,其中12个具有明确的生物学功能。从系统生物学角度来说,可以用这些功能模块来描述IBD相关的生物学功能,主要可分为免疫应答、能量代谢、转录和翻译等四大类(表2)。这些特征和已经报道的IBD异常功能是相一致的。动物模型的研究表明肠道上皮细胞发生免疫应答,导致抗炎和促炎失衡是IBD的可能机制[13]。IBD患者对能量需求比正常人高[14],这可能和炎症组织蛋白质合成增强有关[15]。另外,UC中经常有溃疡发生,因而机体有血管生成的应答[16],但这可能和炎症是相关的。我们鉴定到了血管生成基因的表达在UC和CD间是有差异的,而以往的规模较小的数据分析中往往认为二者没有显著差异[4]或样本量较少[6,7]而缺乏效能。这提示UC和CD可能是2种类似但不同的疾病,其治疗上也应该有所区别,同时也说明WGCNA方法的有效性。但是,需要更大规模的患者数据来确认这个结果。

本研究为了进一步验证这些模块的重要性,利用已有的药物芯片数据进行进一步的药物挖掘。在药物处理细胞表达数据集中进行了初步的药物筛选,发现部分模块受药物作用影响。已有研究利用生物信息方法IBD的药物进行重新发现,其中有些药物是用于治疗消化道肿瘤用的[17]。我们发现模块12(和血管生成相关)表达最低的是伊立替康处理的细胞,伊立替康可能会抑制血管生成,主要被用于结直肠癌伴IBD患者的治疗[18,19]。模块13(和免疫应答相关)表达最低的是曲古抑菌素A处理的细胞,曲古抑菌素A是一种组蛋白乙酰化酶抑制剂,可以抑制肿瘤细胞炎症,也具有治疗IBD的潜能[20]。这也为利用已有药物治疗IBD研究提供一定信息。后续的实验研究可以优先考虑这些药物治疗的动物实验。

综上,本文利用最新的系统生物学方法分析了IBD的基因共表达模块,这些模块反映了IBD的生物学特征,进一步利用药物芯片数据库挖掘潜在药物,为相关研究人员进行发病机制和药物治疗研究提供宝贵信息。

[参考文献]

[1] Wang YF,Ouyang Q,Hu RW.Progression of inflammatory bowel disease in China[J]. J Dig Dis,2010,11(2):76-82.

[2] Leong RW,Lau JY,Sung JJ. The epidemiology and phenotype of Crohn's disease in the Chinese population[J]. Inflamm Bowel Dis,2004,10(5):646-651.

[3] Zhao J,Ng SC,Lei Y,et al. First prospective,population-based inflammatory bowel disease incidence study in mainland of China:The emergence of "western" disease[J]. Inflamm Bowel Dis,2013,19(9):1839-1845.

[4] Granlund A,Flatberg A,Ostvik AE,et al. Whole genome gene expression meta-analysis of inflammatory bowel disease colon mucosa demonstrates lack of major differences between Crohn's disease and ulcerative colitis[J]. PLoS One,2013,8(2):e56818.

[5] Costello CM,Mah N,Hasler R,et al. Dissection of the inflammatory bowel disease transcriptome using genome-wide cDNA microarrays[J]. PLoS Med,2005,2(8):e199.

[6] Fang K,Grisham MB,Kevil CG. Application of Comparative Transcriptional Genomics to Identify Molecular Targets for Pediatric IBD[J]. Front Immunol,2015,6:165.

[7] Mirza AH,Berthelsen CH,Seemann SE,et al. Transcriptomic landscape of lncRNAs in inflammatory bowel disease[J]. Genome Med,2015,7(1):39.

[8] Fuller T,Langfelder P,Presson A,et al. Review of weighted gene coexpression network analysis[J]. Handbook of Statistical Bioinformatics:Springer,2011:369-388.

[9] Oldham MC,Konopka G,Iwamoto K,et al.Functional organization of the transcriptome in human brain[J]. Nat Neurosci,2008,11(11):1271-1282.

[10] Liu W,Li L,Li W. Gene co-expression analysis identifies common modules related to prognosis and drug resistance in cancer cell lines[J]. Int J Cancer,2014,135(12):2795-2803.

[11] Langfelder P,Horvath S. WGCNA:An R package for weighted correlation network analysis[J]. BMC Bioinformatics,2008,9(1):559.

[12] Horvath S,Zhang B,Carlson M,et al. Analysis of oncogenic signaling networks in glioblastoma identifies ASPM as a molecular target[J]. Proc Natl Acad Sci USA,2006, 103(46):17402-17407.

[13] Brown SJ,Mayer L. The immune response in inflammatory bowel disease[J]. Am J Gastroenterol,2007,102(9):2058-2069.

[14] Barot LR,Rombeau JL,Feurer ID,et al. Caloric requirements in patients with inflammatory bowel disease[J]. Ann Surg 1982,195(2):214-218.

[15] El Yousfi M,Breuille D,Papet I,et al. Increased tissue protein synthesis during spontaneous inflammatory bowel disease in HLA-B27 rats[J]. Clin Sci(Lond),2003,105(4):437-446.

[16] Danese S,Sans M,de la Motte C,et al. Angiogenesis as a novel component of inflammatory bowel disease pathogenesis[J]. Gastroenterology,2006,130(7):2060-2073.

[17] Clark PM,Dawany N,Dampier W,et al. Bioinformatics analysis reveals transcriptome and microRNA signatures and drug repositioning targets for IBD and other autoimmune diseases[J]. Inflamm Bowel Dis,2012,18(12):2315-2333.

[18] Jauregui-Amezaga A,Vermeire S,Prenen H. Use of biologics and chemotherapy in patients with inflammatory bowel diseases and cancer[J]. Ann Gastroenterol,2016,29(2):127-136.

[19] Goessling W,Mayer RJ. Systemic treatment of patients who have colorectal cancer and inflammatory bowel disease[J]. Gastroenterol Clin North Am,2006,35(3):713-727.

[20] Edwards AJ,Pender SL. Histone deacetylase inhibitors and their potential role in inflammatory bowel diseases[J].Biochem Soc Trans,2011,39(4):1092-1095.

(收稿日期:2016-12-03)

上一篇:微信公众平台搭建技术初探 下一篇:全程管理护理模式在住院患者外出检查中的应用...