Advances in Clinical Medicine
Vol. 13  No. 07 ( 2023 ), Article ID: 69785 , 7 pages
10.12677/ACM.2023.1371703

加权基因共表达网络鉴定非酒精性脂肪肝核心基因

马博艺

青岛大学附属医院消化内科,山东 青岛

收稿日期:2023年6月25日;录用日期:2023年7月19日;发布日期:2023年7月31日

摘要

非酒精性脂肪肝是指肝脏脂肪累计超过5%。据统计,非酒精性脂肪肝已成为世界范围内最常见的慢性肝脏疾病,影响全球25%成年人口。大约30%的非酒精性脂肪肝患者最终会发展到肝纤维化,肝硬化,肝癌。然而,目前尚未有有效的药物能逆转这一过程。加权基因共表达网络致力于计算每个模块与样本之间的关联性,并寻找网络中的核心基因,为疾病治疗筛选候补靶点。本研究中,我们通过分析57例患者肝脏转录组测序数据,构建了非酒精性脂肪肝共表达基因网络。筛选出与非酒精性脂肪肝高度相关的模块,并对模块内基因进行KEGG富集分析及蛋白互作网络构建,鉴定到30个调控非酒精性脂肪肝进展的关键基因。这30个核心基因中,TGF-β推动了非酒精性脂肪肝向肝癌进展,可能是治疗非酒精性脂肪肝潜在的靶点,为开发非酒精性脂肪肝治疗新靶点提供了理论基础。

关键词

非酒精性脂肪肝,加权基因共表达网络,蛋白互作网络,核心基因

Weighted Gene Co-Expression Network Identifying Core Nonalcoholic Fatty Liver Disease Genes

Boyi Ma

Department of Gastroenterology, Affiliated Hospital of Qingdao University, Qingdao Shandong

Received: Jun. 25th, 2023; accepted: Jul. 19th, 2023; published: Jul. 31st, 2023

ABSTRACT

Non-alcoholic fatty liver disease (NAFLD) is defined as an accumulation of more than 5% fat in the liver. According to statistics, NAFLD has become the most common chronic liver disease worldwide, affecting 25% of the adult population worldwide. Approximately 30% of people with NAFLD will eventually progress to liver fibrosis, cirrhosis and liver cancer. However, there are no effective drugs that can reverse this process. Weighted gene co-expression networks work to calculate the association between each module and the sample, and to find core genes in the network to screen candidate targets for disease treatment. In this study, we constructed a co-expression gene network for NAFLD by analysing liver transcriptome sequencing data from 57 patients. Modules highly associated with NAFLD were screened, and 30 key genes regulating NAFLD progression were identified by KEGG enrichment analysis and protein interaction network construction of genes within the modules. Among these 30 core genes, TGF-β drives the progression of NAFLD to hepatocellular carcinoma and may be a potential target for the treatment of NAFLD, providing a theoretical basis for the development of new targets for the treatment of NAFLD.

Keywords:Non-Alcoholic Fatty Liver Disease, WGCNA, PPI, Hub Genes

Copyright © 2023 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 背景

据统计,非酒精性脂肪肝(NAFLD)在全球成年人口中的发病率为25%,已成为慢性肝病最主要的原因 [1] 。非酒精性脂肪肝(NASH)是非酒精性脂肪肝的晚期形式,其特征是肝脏脂肪变性、炎症、肝细胞损伤和不同程度的纤维化 [2] 。如果不加以治疗,非酒精性脂肪肝炎可能会发展成肝硬化和肝细胞癌,从而威胁到生命。伴随着疾病患病率的增长,因肝硬化和晚期肝病而需要肝移植的人数也在增加 [3] 。此外,目前还没有有效的疗法来逆转NASH。因此,确定支撑和调控非酒精性脂肪肝炎进展的关键因素在基础和临床研究中是最重要的。

非酒精性脂肪肝炎的发展过程大多仍不清楚。实际上,在每一个肝病病例中,细胞死亡都是控制结果和长期后果的基本生物学范式 [4] 。大规模的实质细胞损失是急性肝衰竭的标志,随后是恢复和整合,而在慢性肝病中,免疫细胞的招募、肝星状细胞的激活和慢性肝细胞的周转往往不那么严重,但会导致器官结构和功能的长期变化 [4] 。这些持续的细胞死亡反应导致了肝脏纤维化、肝硬化和癌症的发展 [4] 。非酒精性脂肪肝患者和脂肪性肝炎的实验模型中,通常会出现肝细胞凋亡的增加 [5] [6] 。肝细胞凋亡是通过两种分子途径触发的,即外在的(死亡受体介导的)或内在的(细胞器启动的)途径 [7] 。外在途径涉及死亡配体诱导的受体激活,导致死亡复合物的形成。内在途径是由细胞压力和线粒体功能障碍激活的。这两种凋亡途径都激活了细胞内的蛋白酶,即凋亡酶,它们以一种有组织的方式裂解细胞成分。所产生的凋亡体被Kupffer细胞吞噬,通过激活星状细胞和释放细胞因子促进肝脏纤维化和炎症 [7] 。此外,肝脏具有快速和经常拯救生命的再生能力,因为它的非层次结构,使几乎每一个肝细胞都能作为假性祖细胞或干细胞发挥作用 [8] 。在肝细胞死亡或手术失去肝脏质量后,整个肝脏只需1~2轮肝细胞复制就能得到补充 [4] [9] 。

加权基因共表达网络分析可以将高度关联的基因划分为十几个模块,并计算每一个模块与生物学表型之间的关联。该分析方法致力于计算每个模块与样本之间的关联性,并寻找网络中的核心基因,为疾病治疗筛选候补靶点。本研究中,我们通过对公共数据库数十例非酒精性脂肪肝病人测序数据进行加权基因共表达网络分析,来寻找非酒精性脂肪肝治疗的候补靶点。

2. 方法

2.1. 数据来源

我们从公共数据库GSE 126848下载了57例人类的肝脏转录组测序数据,其中健康供体26例,非酒精性脂肪肝患者31例。并对测序数据进行标准化。

2.2. 加权基因共表达网络分析(WGCNA)

我们使用“WGCNA”R包来寻找GSE 126848芯片中与非酒精性脂肪肝发病相关的基因。1) 计算基因间person相关系数cor(i,j)。2) 计算Sij,以构建无向网络or有向网络,对于无向网络,由于取绝对值,正负相关的基因最后聚类为一个模块,对于有向网络,正相关负相关基因得到的Sij是不一样的,最终聚类则不再同一模块。3) 计算得到邻接矩阵aij,这里的β就是代码里的power,通过β次方,强化强相关,弱化弱相关,基因间关符合无尺度网络分布(R方达到0.85)。4) 计算得到拓扑重叠矩阵TOM,根据可知两个基因的相关性不仅取决于这两个基因的表达量计算得到的值,还取决于这两个基因与这两个基因除外的所有基因的相关性程度。5) 得到模块,并计算模块与临床性状之间的相关系数。

2.3. 京都基因与基因组富集分析

下载人类京都基因与基因组作为参考基因集,将WGCNA筛选与临床性状相关性较高的模块内基因作为输入文件。将红色模块内基因射至背景合集中,使用clusetrprofiler R包进行富集分析。最小基因设定为5,最大基因集设定为5000。p < 0.05且FDR < 0.25认为有统计学意义。

2.4. 蛋白–蛋白互作网络

利用STRING数据库对WGCNA确定的关键基因进行PPI网络分析,并通过cytohubba (cytoscape插件)筛选出30个枢纽基因。分析了这30个基因在GSE 126848中的表达。

3. 结果

3.1. 加权基因共表达网络模块构建

通过WGCNA得到的共表达模块包括一组经常具有高共表达水平和高拓扑重叠相似度的基因。应用皮尔森相关系数对样本进行聚类,得到的样本聚类树如(图1(A))。我们选择了软阈值18 (基于R2 = 0.9的无标度拓扑标准),以得到一个无标度网络。邻接矩阵被转换为TOM矩阵(图1(B)和图1(C)),通过考虑加权相关性来显示节点之间的相似性。最后,通过平均分层聚类和动态树剪得到12个模块(图1(D))。同时,我们计算了每个模块与非酒精行脂肪肝的相关系数。结果表明,红色模块与非酒精性脂肪肝相关性最高(r = 0.89, p = 2e−20)。这说明,在非酒精性脂肪肝向肝硬化甚至肝癌进展的过程中,红色模块内基因可能发挥了重要作用。

3.2. KEGG富集分析

为了探索红色模块内基因在非酒精性脂肪肝进展过程中发挥的作用,我们从KEGG rest API下载了京都基因与基因组百科全书作为参考背景,红色模块内基因映射至背景。使用“cluster profile”R包对红色模块内基因进行富集分析。结果显示红色模块内基因与趋化因子信号途径,粘附分子连接,白细胞穿内皮细胞迁移,血小板激活,成骨细胞分化肾素分泌,Rap1信号通路,Ras信号通路,人类巨细胞病毒感染,查加斯病,B细胞受体信号通路,炎症小体调节TRR通道,磷酸化途径等通路相关(图2)。

Figure 1. Construction of weighted gene co-expression network modules; (A) clustering tree of 57 liver samples (26 in the control group and 31 in the NAFLD group). (B) relationship between scale-free fit indices and various soft threshold powers (left) and between mean connectivity and various soft threshold powers (right). (C) gene clustering tree, each colour represents a module. (D) correlation of each module with clinical phenotype Heat map

图1. 加权基因共表达网络模块构建;(A) 57例肝脏样本聚类树(对照组26例,非酒精性脂肪肝组31例)。(B) 无标度拟合指数与各种软阈值功率之间的关系(左),平均连通性和各种软阈值功率之间的关系(右)。(C) 基因聚类树,每种颜色代表一个模块。(D) 各模块与临床表型相关性热图

3.3. 蛋白互作网络分析

运用cytoscape中的插件cytoHubba进行基因–基因相互作用网络分析,根据节点在网络中的接连接进行排名,确定了前30个基因:TGFBR2,GNB1,FYN,HDAC1,DEPDC5,CDH5,SF3A1,TGFB1,MCCC2,RAB7A,LCP2,CTNND1,CDH2,SNRPD,APP,DLST,SNRNP200,KDR,ENG,GNAS,TRAF6,ACVRL1,WAS,PRPF8,APBA1,PECAM1,NCK2,NCOR2,NRP2,JAK1。这些基因在红色模块内与其他基因连接度高,在调控非酒精性脂肪肝进展过程中发挥了重要作用(图3)。

4. 讨论

目前,非酒精性脂肪肝作为全球最常见的慢性肝脏疾病,影响着全球25%的成年人口,且发病年龄呈现年轻化趋势 [1] 。非酒精性脂肪肝(NASH)是非酒精性脂肪肝的晚期形式,其特征是肝脏脂肪变性、炎症、肝细胞损伤和不同程度的纤维化 [2] [10] [11] 。如果不加以干预,非酒精性脂肪肝炎可能会发展成肝硬化和肝细胞癌,从而威胁到生命。此外,大量临床基础研究表明,合并非酒精性脂肪肝的病人具有更

Figure 2. Results of the Kyoto Encyclopedia of Genes and Genomes (kegg) enrichment analysis

图2. 京都基因与基因组百科全书(kegg)富集分析结果

Figure 3. Protein-protein interactions network results

图3. 蛋白–蛋白互作网络结果

高的肿瘤易感性,此外合并非酒精性脂肪肝的病人更容易出现复发和远处转移 [12] [13] 。然后,目前非酒精性脂肪肝炎尚无有效的治疗靶点。

加权基因共表达网络分析可将基因划分为不同的模块,并寻找与临床表型高度相关的模块。本研究中,我们通过对57例患者肝脏测序数据进行WGCNA分析,鉴定到一个与非酒精性脂肪肝高度相关的模块。随后通过对该模块内基因进行富集分析,我们发现红色模块内基因与趋化因子信号途径,粘附分子连接,白细胞穿内皮细胞迁移,血小板激活,成骨细胞分化肾素分泌,Rap1信号通路,Ras信号通路,人类巨细胞病毒感染,查加斯病,B细胞受体信号通路,炎症小体调节TRR通道,磷酸化途径等通路相关。这些通路可能是调控非酒精性脂肪肝进展的关键通路。随后,对红色模块内基因构建蛋白互作网络,我们共发现了TGFBR2,GNB1,FYN,HDAC1,DEPDC5,CDH5,SF3A1,TGFB1,MCCC2,RAB7A,LCP2,CTNND1,CDH2,SNRPD,APP,DLST,SNRNP200,KDR,ENG,GNAS,TRAF6,ACVRL1,WAS,PRPF8,APBA1,PECAM1,NCK2,NCOR2,NRP2,JAK1这30个核心基因,可能是治疗非酒精性脂肪肝潜在的靶点。

在这些核心基因中,TGF-β家族通过调控肝细胞增殖,分化,迁移维持肝脏功能平衡。在肝脂肪变性向脂肪肝炎,肝纤维化甚至肝癌进展过程中,TGFB发挥了重要作用 [14] 。TGF-β细胞通路在非酒精性脂肪肝的疾病进展中起着多层次的决定性作用。在TGF-β信号通路的下游,例如SMAD 3、SMAD4和p38 MAPK这样的蛋白是非酒精性脂肪肝的关键驱动基因。TGFβ1信号通路是治疗非酒精性脂肪肝和肝纤维化及其进展的潜在药物靶点,目前仍未得到证实。

总之,我们通过分析57例患者肝脏转录组测序数据,构建了非酒精性脂肪肝共表达基因网络。筛选出与非酒精性脂肪肝高度相关的模块,并对模块内基因进行KEGG富集分析及蛋白互作网络构建,鉴定到30个调控非酒精性脂肪肝进展的关键基因,未开发非酒精性脂肪肝治疗新靶点提供了理论基础。

文章引用

马博艺. 加权基因共表达网络鉴定非酒精性脂肪肝核心基因
Weighted Gene Co-Expression Network Iden-tifying Core Nonalcoholic Fatty Liver Disease Genes[J]. 临床医学进展, 2023, 13(07): 12148-12154. https://doi.org/10.12677/ACM.2023.1371703

参考文献

  1. 1. Vernon, G., Baranova, A. and Younossi, Z.M. (2011) Systematic Review: The Epidemiology and Natural History of Non-Alcoholic Fatty Liver Disease and Non-Alcoholic Steatohepatitis in Adults. Alimentary Pharmacology & Therapeu-tics, 34, 274-285. https://doi.org/10.1111/j.1365-2036.2011.04724.x

  2. 2. Schuster, S., Cabrera, D., Arrese, M., et al. (2018) Triggering and Resolution of Inflammation in NASH. Nature Reviews Gastroenterology & Hepatology, 15, 349-364. https://doi.org/10.1038/s41575-018-0009-6

  3. 3. Wong, R.J., Aguilar, M., Cheung, R., et al. (2015) Nonalcoholic Steatohepatitis Is the Second Leading Etiology of Liver Disease among Adults Awaiting Liver Transplanta-tion in the United States. Gastroenterology, 148, 547-555. https://doi.org/10.1053/j.gastro.2014.11.039

  4. 4. Schwabe, R.F. and Luedde, T. (2018) Apoptosis and Necroptosis in the Liver: A Matter of Life and Death. Nature Reviews Gastroenterology & Hepatology, 15, 738-752. https://doi.org/10.1038/s41575-018-0065-y

  5. 5. Qiao, J.T., Cui, C., Qing, L., et al. (2018) Activation of the STING-IRF3 Pathway Promotes Hepatocyte Inflammation, Apoptosis and Induces Metabolic Disorders in Nonalcoholic Fatty Liver Disease. Metabolism, 81, 13-24. https://doi.org/10.1016/j.metabol.2017.09.010

  6. 6. Eguchi, A., Wree, A. and Feldstein, A.E. (2014) Biomarkers of Liver Cell Death. Journal of Hepatology, 60, 1063- 1074. https://doi.org/10.1016/j.jhep.2013.12.026

  7. 7. Alkhouri, N., Carter-Kent, C. and Feldstein, A.E. (2011) Apoptosis in Nonalcoholic Fatty Liver Disease: Diagnostic and Therapeu-tic Implications. Expert Review of Gastroenterology & Hepatology, 5, 201-212. https://doi.org/10.1586/egh.11.6

  8. 8. Nakamura, K., Nonaka, H., Saito, H., et al. (2004) Hepatocyte Proliferation and Tissue Remodeling Is Impaired after Liver Injury in Oncostatin M Receptor Knockout Mice. Hepatology, 39, 635-644. https://doi.org/10.1002/hep.20086

  9. 9. Michalopoulos, G.K. and DeFrances, M.C. (1997) Liver Regen-eration. Science, 276, 60-66. https://doi.org/10.1126/science.276.5309.60

  10. 10. Friedman, S.L., Neuschwander-Tetri, B.A., Rinella, M., et al. (2018) Mechanisms of NAFLD Development and Therapeutic Strategies. Nature Medicine, 24, 908-922. https://doi.org/10.1038/s41591-018-0104-9

  11. 11. Thanapirom, K. and Tsochatzis, E.A. (2019) Non-Alcoholic Fatty Liver Disease (NAFLD) and the Quest for Effective Treatments. The Hepatobiliary Surgery and Nutrition, 8, 77-79. https://doi.org/10.21037/hbsn.2018.11.06

  12. 12. Schulz, P.O., Ferreira, F.G., Nascimento Mde, F., et al. (2015) As-sociation of Nonalcoholic Fatty Liver Disease and Liver Cancer. World Journal of Gastroenterology, 21, 913-918. https://doi.org/10.3748/wjg.v21.i3.913

  13. 13. Brouquet, A. and Nordlinger, B. (2013) Metastatic Colorectal Cancer Outcome and Fatty Liver Disease. Nature Reviews Gastroenterology & Hepatology, 10, 266-267. https://doi.org/10.1038/nrgastro.2013.53

  14. 14. Verrecchia, F. and Mauviel, A. (2004) TGF-Beta and TNF-Alpha: Antagonistic Cytokines Controlling Type I Collagen Gene Expression. Cell Signal, 6, 1873-1880.

期刊菜单