脑胶质瘤是一种极度常见颅腔内的原发性恶性肿瘤,患病人群占据所有颅内肿瘤患者的60%。IV级胶质瘤为最高恶性程度,也称为胶质母细胞瘤(胶质母细胞瘤,GBM),约占全部胶质瘤的55%,且诊断为GBM的患者5年生存率低于6%。许多研究表明,脑胶质瘤中异常表达的lncRNA不仅调控着与癌细胞增殖、凋亡有关的信号转导通路,还与病人的预后有关。利用转录组高通量测序方法,筛选影响脑胶质瘤发生、发展及复发过程中关键通路中的重要基因,对脑胶质瘤的分子诊断、靶向药物的研发及新治疗方案的选择具有重要的价值。本研究通过RNA-seq和生物信息学分析,筛选出在脑胶质瘤组织中差异表达的lncRNA 106种,其中上调表达52种,下调表达54种。microRNA共计15个,其中上调表达8种;下调表达7种。这些差异表达的ncRNA主要参与有机循环化合物代谢过程、胞内运输、细胞蛋白质定位、蛋白质运输、有丝分裂细胞周期、细胞周期调节、DNA代谢过程的正调控、水解酶活性的调节等生物过程、生物调节、应激反应、多细胞有机体过程、细胞成分的组织或生物发生、细胞定位、信号途径、发育过程、生物过程的正调控与负调控。经lncRNA-miRNA-mRNA关联分析,建立了ceRNAs调控网络,明确了lncRNA、miRNA与靶标mRNA之间的对应关系。这些关键lncRNA的筛选,为脑胶质瘤的诊断及治疗提供了新的思路与方向。 Glioma is an extremely common primary malignant tumor in the cranial cavity, which accounts for 60% of all patients with intracranial tumors. Grade IV glioma is the highest degree of malignancy, also called glioblastoma (glioblastoma, GBM), accounting for about 55% of all gliomas, and the 5-year survival rate of patients diagnosed with GBM is lower than 6%. Many studies have shown that the abnormally expressed lncRNA in brain gliomas not only regulates the signal transduction pathways related to cancer cell proliferation and apoptosis, but is also related to the patient’s prognosis. Using transcriptome high-throughput sequencing to screen important genes in key pathways that affect the development, development and recurrence of glioma is of great value for molecular diagnosis of glioma, research and development of targeted drugs and selection of new treatment options. In this study, through RNA-seq and bioinformatics analysis, 106 types of lncRNAs that are differentially expressed in glioma tissues were screened, of which 52 were up-regulated and 54 were down-regulated. There are a total of 15 microRNAs, of which 8 are up-regulated and 7 are down-regulated. These differentially expressed ncRNAs are mainly involved in the metabolic process of organic circulating compounds, intracellular transport, cell protein localization, protein transport, mitotic cell cycle, cell cycle regulation, positive regulation of DNA metabolism, regulation of hydrolase activity and other biological processes and biological regulation, Stress response, multicellular organism process, tissue or biogenesis of cell components, cell location, signal pathway, development process, positive and negative regulation of biological processes. After lncRNA-miRNA-mRNA association analysis, a ceRNAs regulatory network was established, and the correspondence between lncRNA, miRNA and target mRNA was clarified. The screening of these key lncRNAs provides new ideas and directions for the diagnosis and treatment of glioma.
脑胶质瘤是一种极度常见颅腔内的原发性恶性肿瘤,患病人群占据所有颅内肿瘤患者的60%。IV级胶质瘤为最高恶性程度,也称为胶质母细胞瘤(胶质母细胞瘤,GBM),约占全部胶质瘤的55%,且诊断为GBM的患者5年生存率低于6%。许多研究表明,脑胶质瘤中异常表达的lncRNA不仅调控着与癌细胞增殖、凋亡有关的信号转导通路,还与病人的预后有关。利用转录组高通量测序方法,筛选影响脑胶质瘤发生、发展及复发过程中关键通路中的重要基因,对脑胶质瘤的分子诊断、靶向药物的研发及新治疗方案的选择具有重要的价值。本研究通过RNA-seq和生物信息学分析,筛选出在脑胶质瘤组织中差异表达的lncRNA 106种,其中上调表达52种,下调表达54种。microRNA共计15个,其中上调表达8种;下调表达7种。这些差异表达的ncRNA主要参与有机循环化合物代谢过程、胞内运输、细胞蛋白质定位、蛋白质运输、有丝分裂细胞周期、细胞周期调节、DNA代谢过程的正调控、水解酶活性的调节等生物过程、生物调节、应激反应、多细胞有机体过程、细胞成分的组织或生物发生、细胞定位、信号途径、发育过程、生物过程的正调控与负调控。经lncRNA-miRNA-mRNA关联分析,建立了ceRNAs调控网络,明确了lncRNA、miRNA与靶标mRNA之间的对应关系。这些关键lncRNA的筛选,为脑胶质瘤的诊断及治疗提供了新的思路与方向。
胶质瘤,lncRNA,miRNA,ceRNA网络,联合分析
Mingyang Li, Shichao Wang, Yu Ling, Chunxia Liu, Junwei Cao, Yanru Zhang*
Key Laboratory of Biomanufacturing of Inner Mongolia Autonomous Region, Inner Mongolia Agricultural University, Hohhot Inner Mongolia
Received: Dec. 20th, 2020; accepted: Jan. 20th, 2021; published: Jan. 27th, 2021
Glioma is an extremely common primary malignant tumor in the cranial cavity, which accounts for 60% of all patients with intracranial tumors. Grade IV glioma is the highest degree of malignancy, also called glioblastoma (glioblastoma, GBM), accounting for about 55% of all gliomas, and the 5-year survival rate of patients diagnosed with GBM is lower than 6%. Many studies have shown that the abnormally expressed lncRNA in brain gliomas not only regulates the signal transduction pathways related to cancer cell proliferation and apoptosis, but is also related to the patient’s prognosis. Using transcriptome high-throughput sequencing to screen important genes in key pathways that affect the development, development and recurrence of glioma is of great value for molecular diagnosis of glioma, research and development of targeted drugs and selection of new treatment options. In this study, through RNA-seq and bioinformatics analysis, 106 types of lncRNAs that are differentially expressed in glioma tissues were screened, of which 52 were up-regulated and 54 were down-regulated. There are a total of 15 microRNAs, of which 8 are up-regulated and 7 are down-regulated. These differentially expressed ncRNAs are mainly involved in the metabolic process of organic circulating compounds, intracellular transport, cell protein localization, protein transport, mitotic cell cycle, cell cycle regulation, positive regulation of DNA metabolism, regulation of hydrolase activity and other biological processes and biological regulation, Stress response, multicellular organism process, tissue or biogenesis of cell components, cell location, signal pathway, development process, positive and negative regulation of biological processes. After lncRNA-miRNA-mRNA association analysis, a ceRNAs regulatory network was established, and the correspondence between lncRNA, miRNA and target mRNA was clarified. The screening of these key lncRNAs provides new ideas and directions for the diagnosis and treatment of glioma.
Keywords:Glioma, lncRNA, miRNA, ceRNA Network, Conjoint Analysis
Copyright © 2021 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
脑胶质瘤是一种极度常见颅腔内的原发性恶性肿瘤,患病人群占据所有颅内肿瘤患者的60%。常因神经突触中的实质细胞或间质细胞发生畸变所致 [
lncRNA是一类长度大于200 bp的RNA,缺少有意义的开放阅读框,但能以RNA的形式在表观遗传修饰、转录水平、转录后水平调控肿瘤的增殖、诱导凋亡、血管生成、侵袭和转移。lncRNA可通过以下两种形式调控信号转导通路:Cis-lncRNA一般通过转录干扰或募集染色质修饰复合物进行染色质修饰来调控与其临近的上下游的蛋白编码基因;trans-lncRNA可以独立于序列互补,靶向基因位点发挥功能,除了染色质修饰复合物外,还可以与转录延伸因子RNA聚合酶结合,从而影响转录。一些具有结合miRNA位点的lncRNA,可作为竞争性内源性RNA (competing endogenous RNA, ceRNA)与miRNA靶基因竞争性结合miRNA,进而调控miRNA及miRNA靶基因的表达,从而影响肿瘤增殖、凋亡过程 [
二代测序(Next-generation sequencing, NGS),也称为大规模平行测序 [
综上,本研究在脑胶质瘤病例中,取脑胶质瘤组织为样本,通过RNA-Seq [
2017年11月至2018年2月共采集四例符合《中国中枢神经系统胶质瘤诊断与治疗指南(2015)》 [
编号 | 性别 | 年龄 | 癌组织编号 | 癌旁组织编号 | 离体时间(分钟) |
---|---|---|---|---|---|
A | 女 | 35 | AT | AC | <5 |
B | 女 | 57 | BT | BC | <5 |
C | 男 | 60 | CT | CC | <5 |
D | 男 | 43 | DT | DC | <5 |
Q (四组混测) | - | - | Q1 | Q2 | -- |
表1. 样本分组情况记录表
RNA的分离、纯化和质量控制使用Qiagen RNeasy Mini Kit (Qiagen,德国)从脑胶质瘤样本组织中提取总RNA。再对提取得到的RNA使用Nano Photometer分光光度计(IMPLEN,美国)、含Qubit RNA Assay Kit (Life Technologies,美国)的Qubit 2.0 Flurometer和含RNA Nano 6000 Assay Kit (Agilent Technologies,美国)的Bioanalyzer 2100系统来检测RNA的纯度,浓度和完整性。
测序工作由天津诺禾致源基因测序公司完成,miRNA、lncRNA独立建库,即去除样本中的核糖体RNA,然后对其进行测序。
样品检测合格后,使用Small RNA Sample Pre Kit构建文库,利用Small RNA的3’及5’端特殊结构(5’端有完整的磷酸基团,3’端有羟基),以total RNA为起始样品,直接将Small RNA两端加上接头,然后反转录合成cDNA。随后经过PCR扩增,PAGE胶电泳分离目标DNA片段,切胶回收得到的即为cDNA文库。
文库构建完成后,先使用Qubit2.0进行初步定量,稀释文库至1 ng/ul,随后使用Agilent 2100对文库的insert size进行检测,insert size符合预期后,使用Q-PCR方法对文库的有效浓度进行准确定量(文库有效浓度 > 2 nM),以保证文库质量。
库检合格后,把不同文库按照有效浓度及目标下机数据量的需求pooling后进行HiSeq/MiSeq测序。
原始测序数据(raw data)经去除接头和低质量reads等处理后得到有效数据(clean data)。使用Tophat2 [
根据顺式cis作用原理:lncRNA临近位置(上下游100 kb)的蛋白编码基因作为其靶基因;反式trans作用原理:样本间lncRNA与蛋白编码基因的表达量采用Pearson相关系数法分析(相关系数 > 0.95)来预测lncRNA的靶基因。对差异表达的lncRNA、miRNA和mRNA使用GOseq [
在生物体内,不同基因相互协调行使其生物学功能,通过Pathway显著性富集能确定候选靶基因参与的最主要生化代谢途径和信号转导途径。KEGG (Kyoto Encyclopedia of Genes and Genomes)是有关Pathway的主要公共数据库 [
p = 1 − ∑ i = 0 m − 1 ( M i ) ( N − M n − i ) ( N n )
其中,N为所有基因中具有Pathway注释的基因数目;n为N中候选靶基因的数目;M为所有基因中注释为某特定Pathway的基因数目;m为注释为某特定Pathway的候选靶基因数目。用BH的方法对p-value进行校正,得到的校正后的P-value值越小代表越显著。这里将值小于0.05的Pathway定义为在候选靶基因中显著富集的Pathway。
测序结果利用韦恩图显示四组间共有的差异lncRNA数目为零,如图1所示。因此以混测组(GLQ1_vs_GLQ2)所得差异表达的lncRNA为样本,对其共表达的基因进行GO富集,在混测组(GLQ1_vs_GLQ2)中差异lncRNA共计106个,其中上调52个包括lnc_000266、lnc_000276、lnc_000417、
图1. 差异表达lncRNA火山图
lnc_000510、lnc_000565、lnc_000662、lnc_000853、lnc_001155、lnc_001315、lnc_001370、lnc_001788、lnc_001827等;下调54个,包括ENST00000572151、lnc_000009、lnc_000021、lnc_000036、lnc_000115、lnc_000410、lnc_000467等(见表2);如图2所示。在GO富集结果分类统计图中,从左往右依次为生物学过程、细胞组分、分子功能包括,如图3所示。结果显示差异lncRNA主要参与有机循环化合物代谢过程、胞内运输、细胞蛋白质定位、蛋白质的运输、有丝分裂细胞周期、细胞周期调节、DNA代谢过程的正调控、水解酶活性的调节等生物过程。如图4所示。差异lncRNA共表达mRNA的KEGG富集通路散点图如图4,主要富集的细胞通路有血小板激活、基础转录因子及补体和凝血级联等相关途径。q-value的取值范围为[0, 1],越接近于零,表示富集结果的可信度越高。差异表达转录本(lncRNA)所对应的靶基因进行了GO富集分析,主要富集在有机循环化合物代谢过程、胞内运输、细胞蛋白质定位、蛋白质的运输、有丝分裂细胞周期、细胞周期调节、DNA代谢过程的正调控、水解酶活性的调节等生物过程。
转录本ID transcript_id | 基因ID gene_id | 基因名 gene_name | 癌组织表达量 GLQ1_FPKM | 癌旁组织表达量 GLQ2_FPKM | log2. foldchange. | pval | padj |
---|---|---|---|---|---|---|---|
ENST00000329743.3 | ENSG00000185837.3 | CECR5-AS1 | 1.321697 | 0 | Inf | 0.005694 | 0.456532 |
ENST00000412495.5 | ENSG00000174403.15 | C20orf166-AS1 | 0.055641 | 0.361857 | −2.7012 | 0.031411 | 1 |
ENST00000424587.6 | ENSG00000228463.9 | AP006222.2 | 0.197026 | 0 | Inf | 0.017627 | 0.821515 |
ENST00000425112.1 | ENSG00000235954.6 | TTC28-AS1 | 0.777166 | 0.078821 | 3.30158 | 0.03762 | 1 |
ENST00000425271.1 | ENSG00000229588.1 | RP11-479J7.2 | 0 | 0.253397 | Inf | 0.043235 | 1 |
ENST00000426715.5 | ENSG00000237737.5 | DCTN1-AS1 | 0.094955 | 1.591254 | −4.06678 | 0.002733 | 0.297451 |
ENST00000435067.2 | ENSG00000235366.2 | LINC01055 | 0.499809 | 0.009094 | 5.780278 | 0.019621 | 0.874801 |
ENST00000444939.1 | ENSG00000235897.1 | TM4SF19-AS1 | 0.203001 | 0 | Inf | 0.03037 | 1 |
ENST00000451837.5 | ENSG00000228315.11 | GUSBP11 | 1.596795 | 0.152712 | 3.386296 | 0.002744 | 0.297989 |
ENST00000463143.5 | ENSG00000243701.5 | DUBR | 0.058796 | 1.161521 | −4.30416 | 0.03242 | 1 |
ENST00000477513.1 | ENSG00000205930.8 | C21orf62-AS1 | 0 | 0.291069 | Inf | 0.03869 | 1 |
ENST00000488584.1 | ENSG00000240875.5 | LINC00886 | 0.241863 | 0 | Inf | 0.039771 | 1 |
ENST00000496389.5 | ENSG00000240057.5 | RP11-572M11.4 | 0.491534 | 0.051418 | 3.256939 | 0.01952 | 0.871556 |
ENST00000505149.1 | ENSG00000249307.5 | LINC01088 | 2.266866 | 0.068304 | 5.052585 | 0.005493 | 0.449092 |
ENST00000505844.1 | ENSG00000248455.5 | RP11-321E2.3 | 0.015737 | 0.329017 | −4.38593 | 0.049939 | 1 |
ENST00000507761.1 | ENSG00000249307.5 | LINC01088 | 4.470149 | 0.870082 | 2.361099 | 0.030368 | 1 |
ENST00000509088.5 | ENSG00000249307.5 | LINC01088 | 10.85965 | 1.550521 | 2.808152 | 0.016659 | 0.800687 |
ENST00000510087.5 | ENSG00000247828.7 | TMEM161B-AS1 | 0.542471 | 3.541659 | −2.70681 | 0.020203 | 0.891566 |
ENST00000521404.5 | ENSG00000214548.14 | MEG3 | 0.265479 | 0 | Inf | 0.020493 | 0.897167 |
ENST00000522747.5 | ENSG00000245146.6 | LINC01024 | 0 | 0.138021 | Inf | 0.031289 | 1 |
ENST00000540882.5 | ENSG00000256193.5 | LINC00507 | 0.015798 | 0.974333 | −5.94665 | 0.022486 | 0.936989 |
ENST00000568966.2 | ENSG00000260391.2 | RP11-71H17.7 | 1.517343 | 0.099538 | 3.930152 | 0.006726 | 0.496316 |
ENST00000570301.5 | ENSG00000262223.6 | RP11-1055B8.3 | 0 | 0.872976 | Inf | 0.003783 | 0.359047 |
ENST00000572151.1 | ENSG00000263069.5 | CTD-2047H16.4 | 0 | 0.277937 | Inf | 0.028468 | 1 |
ENST00000580045.1 | ENSG00000263766.5 | RP11-580I16.2 | 0.034864 | 0.539885 | −3.95284 | 0.017324 | 0.815143 |
---|---|---|---|---|---|---|---|
ENST00000609442.5 | ENSG00000186594.12 | MIR22HG | 0 | 0.744879 | Inf | 0.001059 | 0.187946 |
ENST00000623070.3 | ENSG00000228794.8 | LINC01128 | 0.010925 | 0.392027 | −5.16525 | 0.010188 | 0.617517 |
LNC_000009 | XLOC_000367 | . | 0.003548 | 0.272429 | −6.26283 | 0.031884 | 1 |
LNC_000021 | XLOC_000434 | . | 0 | 0.873833 | Inf | 0.038025 | 1 |
LNC_000036 | XLOC_000839 | . | 0 | 0.526067 | Inf | 0.01673 | 0.800687 |
LNC_000115 | XLOC_007755 | . | 0 | 0.258049 | Inf | 0.021498 | 0.914279 |
LNC_000266 | XLOC_019040 | . | 0.259798 | 0 | Inf | 0.010122 | 0.61593 |
LNC_000269 | XLOC_019813 | . | 0.319856 | 0 | Inf | 0.027765 | 1 |
LNC_000276 | XLOC_020592 | . | 0.149726 | 0 | Inf | 0.023653 | 0.963619 |
LNC_000410 | XLOC_032710 | . | 0 | 0.184696 | Inf | 0.021326 | 0.911866 |
LNC_000417 | XLOC_033405 | . | 0.171251 | 0 | Inf | 0.027822 | 1 |
LNC_000467 | XLOC_037210 | . | 0 | 0.197732 | Inf | 0.045953 | 1 |
LNC_000479 | XLOC_037967 | . | 0 | 0.154129 | Inf | 0.04384 | 1 |
LNC_000494 | XLOC_039296 | . | 0.004717 | 0.563647 | −6.90085 | 0.013361 | 0.708158 |
LNC_000510 | XLOC_040050 | . | 0.393638 | 0.038834 | 3.341487 | 0.038722 | 1 |
LNC_000521 | XLOC_040623 | . | 0.042489 | 0.400015 | −3.2349 | 0.042694 | 1 |
LNC_000565 | XLOC_045043 | . | 0.264409 | 0 | Inf | 0.017004 | 0.807935 |
LNC_000570 | XLOC_045448 | . | 0 | 0.177139 | Inf | 0.047729 | 1 |
LNC_000662 | XLOC_056010 | . | 0.395915 | 0 | Inf | 0.006839 | 0.501673 |
LNC_000694 | XLOC_060487 | . | 0 | 0.273759 | Inf | 0.004371 | 0.393991 |
LNC_000798 | XLOC_073979 | . | 0 | 0.217494 | Inf | 0.045961 | 1 |
LNC_000845 | XLOC_078789 | . | 0.465307 | 0.053043 | 3.132943 | 0.024325 | 0.974234 |
LNC_000853 | XLOC_080147 | . | 0.588241 | 0.084005 | 2.80786 | 0.043285 | 1 |
LNC_001155 | XLOC_115160 | . | 0.181953 | 0 | Inf | 0.03034 | 1 |
LNC_001173 | XLOC_116066 | . | 0.045814 | 0.434029 | −3.24394 | 0.033192 | 1 |
LNC_001254 | XLOC_122620 | . | 0.005249 | 0.754748 | −7.16795 | 0.022717 | 0.943285 |
LNC_001300 | XLOC_124776 | . | 0 | 0.362518 | Inf | 0.001216 | 0.20293 |
LNC_001315 | XLOC_125784 | . | 0.335061 | 0.023615 | 3.826649 | 0.023139 | 0.952305 |
LNC_001359 | XLOC_129378 | . | 0 | 0.153206 | Inf | 0.029025 | 1 |
LNC_001370 | XLOC_131364 | . | 0.186167 | 0.013987 | 3.734489 | 0.040925 | 1 |
LNC_001521 | XLOC_141586 | . | 0 | 0.418985 | Inf | 0.00059 | 0.140597 |
LNC_001763 | XLOC_161705 | . | 0.329112 | 0.006127 | 5.747195 | 0.022992 | 0.949315 |
LNC_001787 | XLOC_164705 | . | 5.637431 | 0.001648 | 11.74011 | 0.005645 | 0.456448 |
LNC_001788 | XLOC_164705 | . | 2.519544 | 0 | Inf | 0.010249 | 0.619682 |
LNC_001789 | XLOC_164705 | . | 0 | 9.485185 | Inf | 0.002668 | 0.293497 |
LNC_001790 | XLOC_164705 | . | 0.022131 | 1.497452 | −6.08031 | 0.042932 | 1 |
---|---|---|---|---|---|---|---|
LNC_001827 | XLOC_168953 | . | 0.51866 | 0 | Inf | 0.036278 | 1 |
LNC_001934 | XLOC_168978 | . | 0.600014 | 0 | Inf | 0.01441 | 0.740057 |
LNC_002091 | XLOC_169062 | . | 0.386222 | 0.015235 | 4.664016 | 0.045734 | 1 |
LNC_002171 | XLOC_169093 | . | 0 | 0.28152 | Inf | 0.024453 | 0.975955 |
LNC_002196 | XLOC_169112 | . | 0.239854 | 0 | Inf | 0.02842 | 1 |
LNC_002218 | XLOC_169575 | . | 0 | 0.625311 | Inf | 0.020923 | 0.904419 |
LNC_002436 | XLOC_189417 | . | 0 | 0.134111 | Inf | 0.026241 | 1 |
LNC_002514 | XLOC_196104 | . | 0 | 0.178863 | Inf | 0.045259 | 1 |
LNC_002523 | XLOC_196947 | . | 0 | 0.16073 | Inf | 0.040958 | 1 |
LNC_002545 | XLOC_198663 | . | 0.22451 | 0 | Inf | 0.000301 | 0.101765 |
LNC_002576 | XLOC_202277 | . | 0.185142 | 0 | Inf | 0.037008 | 1 |
LNC_002660 | XLOC_210683 | . | 0.175563 | 0 | Inf | 0.037318 | 1 |
LNC_002670 | XLOC_211305 | . | 0.00305 | 0.235054 | −6.26792 | 0.004193 | 0.383829 |
LNC_002738 | XLOC_219310 | . | 1.96684 | 0.442293 | 2.152807 | 0.041188 | 1 |
LNC_002765 | XLOC_223733 | . | 0 | 0.170617 | Inf | 0.047406 | 1 |
LNC_002816 | XLOC_228769 | . | 0 | 0.275173 | Inf | 0.010921 | 0.642293 |
LNC_002819 | XLOC_228781 | . | 0.410449 | 0 | Inf | 2.33E−05 | 0.021745 |
LNC_002830 | XLOC_229641 | . | 0 | 0.354426 | Inf | 0.014756 | 0.748978 |
LNC_002831 | XLOC_229642 | . | 0 | 0.498238 | Inf | 0.041203 | 1 |
LNC_002841 | XLOC_230383 | . | 0 | 0.441705 | Inf | 0.038664 | 1 |
LNC_002927 | XLOC_240626 | . | 0 | 0.342247 | Inf | 0.009353 | 0.595621 |
LNC_002940 | XLOC_243325 | . | 0 | 0.187294 | Inf | 0.021126 | 0.909446 |
LNC_002965 | XLOC_247874 | . | 0.293177 | 0.023328 | 3.651653 | 0.030167 | 1 |
LNC_002996 | XLOC_249865 | . | 0.17017 | 0 | Inf | 0.044745 | 1 |
LNC_003083 | XLOC_259353 | . | 0.301593 | 0 | Inf | 0.018348 | 0.839064 |
LNC_003092 | XLOC_260368 | . | 0 | 0.181184 | Inf | 0.033685 | 1 |
LNC_003160 | XLOC_265610 | . | 0.529069 | 0.019271 | 4.778952 | 0.009191 | 0.589476 |
LNC_003191 | XLOC_268753 | . | 0.168433 | 0 | Inf | 0.009208 | 0.589747 |
LNC_003225 | XLOC_272726 | . | 0.268701 | 0.011997 | 4.485256 | 0.025239 | 0.992031 |
LNC_003259 | XLOC_276571 | . | 0.342624 | 0 | Inf | 0.014933 | 0.755263 |
LNC_003277 | XLOC_277968 | . | 0.212491 | 0 | Inf | 0.01983 | 0.88007 |
LNC_003306 | XLOC_282244 | . | 0 | 0.381837 | Inf | 0.039356 | 1 |
LNC_003371 | XLOC_288937 | . | 0.12854 | 0 | Inf | 0.024828 | 0.981586 |
LNC_003426 | XLOC_296063 | . | 0 | 0.330483 | Inf | 0.010965 | 0.642886 |
LNC_003482 | XLOC_302093 | . | 0.31455 | 0 | Inf | 0.003595 | 0.34929 |
LNC_003495 | XLOC_303175 | . | 0.174044 | 0 | Inf | 0.003122 | 0.321776 |
LNC_003498 | XLOC_303273 | . | 0 | 0.080993 | Inf | 0.044795 | 1 |
LNC_003557 | XLOC_311294 | . | 0.203297 | 0 | Inf | 0.03206 | 1 |
LNC_003613 | XLOC_317217 | . | 0.849733 | 0.049924 | 4.089205 | 0.012542 | 0.684973 |
---|---|---|---|---|---|---|---|
LNC_003671 | XLOC_325487 | . | 0 | 0.125253 | Inf | 0.029909 | 1 |
LNC_003672 | XLOC_325487 | . | 0.155251 | 0 | Inf | 0.032466 | 1 |
LNC_003745 | XLOC_332734 | . | 0.344085 | 0.004141 | 6.376727 | 0.011558 | 0.655778 |
LNC_003874 | XLOC_345209 | . | 0.010717 | 0.320129 | −4.90075 | 0.001472 | 0.220468 |
LNC_003875 | XLOC_345209 | . | 0.003259 | 0.698022 | −7.74281 | 6.20E−05 | 0.040318 |
LNC_003988 | XLOC_357378 | . | 0 | 0.386403 | Inf | 0.024658 | 0.980174 |
表2. 混测组(GLQ1_vs_GLQ2)差异lncRNA筛选结果
图2. 组间差异表达lncRNA韦恩图
图3. 混测组(GLQ1_vs_GLQ2)差异lncRNA共表达基因GO富集分类统计图
图4. 混测组(GLQ1_vs_GLQ2)差异lncRNA共表达基因KEGG途径富集散点图
将多组比较的差异miRNA个数进行统计,绘制维恩图,直观展现出各个比较组共有及特有的差异miRNA数目(见图5)。如图6所示,四组建交集miRNA数目为零,因此以混测组(GLQ1_vs_GLQ2)所得结果进行后期分析。混测组(GLQ1_vs_GLQ2)差异microRNA共计15个(见表3),如图6所示。其中上调8个包hsa-miR-3157-3p、hsa-miR-6761-5p、hsa-miR-3124-5p、hsa-miR-5009-5p、hsa-miR-216b-3p、hsa-miR-296-3p、novel_912、novel_328;下调7个,hsa-miR-135b-5p、hsa-miR-377-3p、hsa-miR-136-5p、hsa-miR-381-3p、hsa-miR-153-5p、hsa-miR-299-3p、hsa-miR-4473。富集的GO相关的所有差异miRNA靶基因(见表4,无确定靶基因则未列出)的分类统计图,从左往右依次为生物学过程、细胞组分、分子功能包括,如图7所示。结果显示差异miRNA主要参与细胞过程、生物调节、代谢过程、应激反应、多细胞有机体过程、细胞成分的组织或生物发生、细胞定位、信号途径、发育过程、生物过程的正调控、生物过程的负调控。如图7所示。差异miRNA靶基因的KEGG富集通路散点图如图8,主要富集的细胞通路维生素的消化吸收、肿瘤坏死因子信号通路、突触囊泡循环、唾液分泌、癌症中的蛋白多糖、蛋白质输出、癌症相关通路、胰腺癌等相关途径。(q-value的取值范围为[0, 1],越接近于零,表示富集结果的可信度越高)。
miRNA编号 miRNA-ID | 癌组织表达量 GLQ1_readcount | 癌旁组织表达量 GLQ2_readcount | log2FoldChange | pval | padj |
---|---|---|---|---|---|
hsa-miR-135b-5p | 88.99762 | 163.8794 | −0.77662 | 0.004145 | 0.99975 |
hsa-miR-377-3p | 75.37529 | 170.7388 | −0.92773 | 0.006783 | 0.99975 |
hsa-miR-3157-3p | 9.345945 | 3.034668 | 1.0028 | 0.013002 | 0.99975 |
hsa-miR-136-5p | 632.8087 | 1442.705 | −0.8977 | 0.01311 | 0.99975 |
hsa-miR-381-3p | 8668.745 | 17737.01 | −0.8269 | 0.01399 | 0.99975 |
novel_912 | 2.42883 | 0 | 0.88379 | 0.016828 | 0.99975 |
hsa-miR-6761-5p | 7.562805 | 2.212444 | 0.9635 | 0.021225 | 0.99975 |
hsa-miR-3124-5p | 15.3221 | 7.072264 | 0.82849 | 0.024967 | 0.99975 |
hsa-miR-5009-5p | 1.709722 | 0 | 0.8047 | 0.026246 | 0.99975 |
novel_328 | 7.026624 | 2.158375 | 0.89549 | 0.032114 | 0.99975 |
hsa-miR-153-5p | 19.4879 | 33.3998 | −0.64796 | 0.039772 | 0.99975 |
hsa-miR-216b-3p | 2.787696 | 0.292098 | 0.78371 | 0.041112 | 0.99975 |
hsa-miR-299-3p | 79.26836 | 197.027 | −0.81686 | 0.045115 | 0.99975 |
hsa-miR-4473 | 20.53004 | 44.69347 | −0.7704 | 0.047291 | 0.99975 |
hsa-miR-296-3p | 27.00353 | 9.479225 | 0.82828 | 0.04798 | 0.99975 |
表3. 混测组(GLQ1_vs_GLQ2)差异miRNA筛选结果
miRNA编号 miRNA-ID | 靶基因编号 | 靶基因名称 | 描述 |
---|---|---|---|
hsa-miR-3157-3p | ENSG00000141738 | GRB7 | 生长因子受体结合蛋白7 |
ENSG00000151353 | TMEM18 | 跨膜蛋白18 | |
ENSG00000161011 | SQSTM1 | 螯合体1 | |
ENSG00000165458 | INPPL1 | 肌醇多磷酸磷酸酶类似物1 | |
ENSG00000168748 | CA7 | 碳酸酐酶7 | |
ENSG00000183837 | PNMA3 | PNMA家庭成员3 | |
hsa-miR-381-3p | ENSG00000145191 | EIF2B5 | 真核翻译起始因子2B亚基ε |
novel_912 | ENSG00000015153 | YAF2 | YY1相关因子2 |
ENSG00000170949 | ZNF160 | 锌指蛋白160 | |
ENSG00000179921 | GPBAR1 | G蛋白偶联的胆汁酸受体1 | |
ENSG00000188938 | FAM120AOS | 序列相似性为120A反向链的家族 | |
ENSG00000281348 | AC120114.4 | 智人16号染色体克隆CTD-2574D22完整序列 | |
hsa-miR-6761-5p | ENSG00000078070 | MCCC1 | 甲基巴豆酰辅酶A羧化酶1 |
ENSG00000100578 | KIAA0586 | KIAA0586 | |
ENSG00000109339 | MAPK10 | 丝裂原激活的蛋白激酶10 | |
ENSG00000196209 | SIRPB2 | 信号调节蛋白β2 |
hsa-miR-3124-5p | ENSG00000105737 | GRIK5 | 谷氨酸离子受体的海藻酸酯型亚基5 |
---|---|---|---|
ENSG00000107742 | SPOCK2 | 骨结合蛋白cwcv和kazal样结构域蛋白聚糖2 | |
novel_328 | ENSG00000109917 | ZPR1 | ZPR1锌指 |
hsa-miR-299-3p | ENSG00000090447 | TFAP4 | 转录因子AP-4 |
ENSG00000146576 | C7orf26 | 7号染色体开放阅读框26 | |
ENSG00000167920 | TMEM99 | 跨膜蛋白99 (可能) | |
ENSG00000173638 | SLC19A1 | 溶质载体家族19成员1 | |
ENSG00000196345 | ZKSCAN7 | 具有KRAB和SCAN域的锌指7 | |
hsa-miR-296-3p | ENSG00000006025 | OSBPL7 | 氧固醇结合蛋白类似物7 |
ENSG00000007001 | UPP2 | 尿苷磷酸化酶2 | |
ENSG00000023191 | RNH1 | 核糖核酸酶/血管生成素抑制剂1 | |
ENSG00000068903 | SIRT2 | sirtuin 2 | |
ENSG00000089041 | P2RX7 | 嘌呤能受体P2X 7 | |
ENSG00000089060 | SLC8B1 | 溶质载体家族8成员B1 | |
ENSG00000092096 | SLC22A17 | 溶质载体家族22成员17 | |
ENSG00000099812 | MISP | 有丝分裂纺锤体定位 | |
ENSG00000100401 | RANGAP1 | Ran GTPase激活蛋白1 | |
ENSG00000100985 | MMP9 | 基质金属肽酶9 |
表4. 混测组(GLQ1_vs_GLQ2)差异miRNA及其靶基因对照
图5. 组间差异表达microRNA韦恩图
图6. 混测组(GLQ1_vs_GLQ2)差异microRNA火山图
图7. 混测组(GLQ1_vs_GLQ2)差异microRNA靶基因GO富集分类统计图
图8. 混测组(GLQ1_vs_GLQ2)差异microRNA KEGG途径富集散点图
lncRNA具有广泛的调控作用,不仅能够直接调控DNA的结构、RNA的转录和翻译,而且具有miRNA结合位点,可以竞争性地结合miRNA,抑制miRNA对靶基因的调节作用,从而间接地调控基因表达。根据ceRNAs理论,筛选具有相同miRNA结合位点的lncRNA-gene 关系对,构建以lncRNA为起始、miRNA为核心、mRNA为靶标的lncRNA-miRNA-gene组合来构建ceRNA调控网络(图8~10)。在全转录组层面,通过ceRNA调控网络,揭示非编码RNA调控基因表达的机制。
统计筛选得到的lncRNA-miRNA-gene组合中上下调RNA的数目,可以直观展现不同组合中相关基因数目的变化。不同的形状代表不同的RNA种类,不同颜色代表上下调关系,不同的节点(node)的大小与此节点在通路中所处位置的重要程度(degree)成正比,即与此节点相连的边越多,它的重要程度越大,节点也就越大,这些节点在网络中可能处于较为核心的位置,与所研究的生物学问题更相关。
根据筛选所得数据,分别建立lncRNA (down)-miRNA (up)-mRNA (down)和lncRNA (up)-miRNA (down)-mRNA (up)三级互作关系网络(图9~11)。在lncRNA (down)-miRNA (up)-mRNA (down)网络中,以hsa-miR-296-3p为中间节点,上游lncRNA:LNC_002514、LNC_001173下调表达,使得hsa-miR-296-3p表达量增加,进而下游基因:MRAS (ENSG00000158186)、GABBR1 (ENSG00000204681)、AIFM3 (ENSG00000183773)、TRIM26 (ENSG00000234127)、ZNF875 (ENSG00000181666)、HNRNPUL1 (ENSG00000105323)、FOSL1 (ENSG00000175592)、INO80E (ENSG00000169592)、PDGFRB (ENSG00000113721)的表达量也随之下调(见表5),对以上9种下调表达的基因进行KEGG富集,共到6条通路,分别为HTLV-I感染、磷脂酶D信号通路、肌动蛋白细胞骨架的调节、Rap1信号通路、Ras信
图9. 全部差异lncRNA-miRNA-mRNA互作图
号通路、MAPK信号通路。其中下调表达的lncRNA:LNC_001173与LNC_002436、LNC_001254分别调控两种miRNA:hsa-miR-6761-5p和hsa-miR-3157-3p的表达量上调,而相应的hsa-miR-6761-5p的靶基因KIAA0586 (ENSG00000100578)、hsa-miR-3157-3p的靶基因PNMA3 (ENSG00000183837)的表达量也随之下调。在lncRNA (up)-miRNA (down)-mRNA (up)互作网络中,8种上调表达的lncRNA:LNC_003613、LNC_003495、LNC_000853、LNC_000276、LNC_003672、LNC_002545、ENST00000509088、ENST00000505149可调控miRNA:hsa-miR-299-3p使之表达减少,并使下游基因SLC19A1 (ENSG00000173638)的表达量同步增加。
在以上数据筛选基础上,将上述结果与Targetscan数据库中已有的miRNA与靶基因的互作结合位点进行比对,在上述lncRNA (down)-miRNA (up)-mRNA (down)网络中只有FOSL1 (ENSG00000175592)与hsa-miR-296-3p有两个确定的互作位点,上游下调的两个:LNC_002514、LNC_001173均无文献数据支持,但LNC_001173在本次筛选结果中涉及内容过多,验证难度较大,因此拟建立由LNC_002514-hsa-miR-296-3p-FOSL1组成的轴向调控通路(图12),以备后期研究验证。
基因编号Gene stable ID | 基因名Gene name | 描述Description |
---|---|---|
ENSG00000105323 | HNRNPUL1 | 异核核糖核蛋白U样1 |
ENSG00000113721 | PDGFRB | 血小板衍生的生长因子受体β |
ENSG00000158186 | MRAS | 肌肉RAS癌基因同源物 |
ENSG00000169592 | INO80E | INO80复合亚基E |
ENSG00000175592 | FOSL1 | FOS类似1,AP-1转录因子亚基 |
ENSG00000181666 | ZNF875 | 锌指蛋白875 |
ENSG00000183773 | AIFM3 | 凋亡诱导因子线粒体相关3 |
ENSG00000204681 | GABBR1 | γ-氨基丁酸B型受体亚基1 |
ENSG00000234127 | TRIM26 | Tripartite基序蛋白26 |
ENSG00000183837 | PNMA3 | 副肿瘤抗原样3基因3 |
ENSG00000100578 | KIAA0586 | KIAA0586 |
ENSG00000173638 | SLC19A1 | 溶质载体家族19成员1 |
表5. 基因ID及其中英文基因名对照表
图10. 差异lncRNA (down)-miRNA (up)-mRNA (down)互作网络图
图11. 差异lncRNA (up)-miRNA (down)-mRNA (up)互作网络图
图12. LNC_002514-hsa-miR-296-3p-FOSL1轴向调控通路图
通过肿瘤RNA测序(RNA-Seq)监控基因和转录组的表达变化可以协助了解肿瘤的分类和发展,全转录组测序不仅可以得到每种RNA的全套分析结果,还可通过二重、三重关联分析,对目标基因的范围进行有效的缩小,进而得到准确的关键基因。本研究基于二代测序技术的全转录组测序研究,同时分析样本中差异表达的mRNA,lncRNA,miRNA,并且通过两两关联分析、三元关联分析,建立可能的ceRNA调控网络,使研究内容更加系统化,致力于深入挖掘生命现象背后的转录调控问题。
在本次测序结果中,已知有注释的差异lncRNA四种:HOXD-AS2 [
本次测序也发现多个未注释的差异lncRNA,但其对胶质瘤的调控机制还有待进一步实验验证。而lncRNA:LNC_002514、LNC_001173、LNC_002436和LNC_001254目前在人类疾病方面尚未研究,因此作为潜在生物标记,为今后的研究验证工作提供方向。
在本次测序结果中,差异表达的miRNA:hsa-miR-296-3p在人脐带静脉内皮细胞(HUVEC)中的miRNA和mRNA表达谱相关研究中差异调节涉及细胞粘附,血管生成,细胞周期,JAK-STAT信号传导,MAPK信号传导,一氧化氮信号传导,VEGF信号传导和伤口愈合途径的基因。此外,基于q-PCR的miRNA和mRNA上调和下调实验研究表明,hsa-miR-296-3p等miRNA有效地影响斜管恒温器刺激微重力(MG)条件下HUVEC的细胞增殖和血管功能。对相互作用组结果的共识表明,暴露于短期MG的HUVEC转录组的波动受限,这可能导致较高水平的内皮功能,如血管生成和血管形成 [
受差异miRNA调控的下游靶基因共12种:PDGFRB [
血小板衍生的生长因子(PDGF)信号通路驱动高度神经胶质瘤(HGG)进程,并且PDGF受体(PDGFRs)的表达增强是胶质母细胞瘤(GBMs)子集中的一种普遍的突变。PDGFRA在神经胶质瘤细胞中表达,而PDGFRB主要限于与神经胶质瘤相关的基质。相关研究还显示,小胶质细胞(TAMMs)的空间位置与已经获得PDGFRB在小鼠和人类低级神经胶质瘤和HCGs中表达的肿瘤细胞亚群的扩展相关。此外,M2极化的小胶质细胞诱导神经胶质瘤细胞中PDGFRB的表达并刺激其迁移能力 [
MRAS是相对于经典RAS癌蛋白而言最接近的,并且共享大多数调节和效应子相互作用。但是它也具有独特的功能,包括与SHOC2和蛋白磷酸酶1 (PP1)结合时,具有磷酸酶调节亚基的功能。这种磷酸酶复合物调节RAF激酶激活周期中的关键步骤,并提供有效的ERK途径激活和RAS转化所需的关键坐标输入。MRAS突变很少在癌症中发生,但在某些情况下表达失调可能在肿瘤发生中起作用。在RAS病Noonan综合征中确实发生了MRAS的激活突变(以及SHOC2和PP1),这强调了RAS-ERK途径中MRAS的关键作用。MRAS在细胞迁移和分化中也具有独特作用,其性质与细胞极性调节中的关键作用相一致 [
INO80E在评估异基因造血干细胞移植(HSCT)在胰腺导管腺癌治疗中的免疫学作用中,是及其重要的免疫应答指标。并能够对临床和生物学相关细胞免疫组库的建立产生影响 [
2020年4月FOSL1在低级神经胶质瘤(LGG)的研究中,通过比较不同类型肿瘤之间的FOSL1表达,探索TCGA-LGG和亚组中FOSL1表达与总体生存(OS)之间的关联。结果表明:LGG中的FOSL1表达在21种不同的癌症中排名第一。FOSL1表达较低的LGG的OS较长(P < 0.001)。星形细胞瘤组的FOSL1表达最高,OS最短,其次是少星形细胞瘤和少突胶质细胞瘤(P < 0.05)。1p19q共缺失或IDH突变亚组具有较低的FOSL1表达和较长的OS (P < 0.001)。与相应的组相比,FOSL1表达较低的LGG的OS比以下组更长,因此0FOSL1是LGG和亚组的预后标志物 [
在lncRNA (down)-miRNA (up)-mRNA (down)网络中,经过生物信息学分析后发现LNC_002514表达量下降,释放hsa-miR-296-3p作用于下游基因:FOSL1。
在2019年12月发表的关于冠状动脉疾病(CAD)的生物标记文章中,研究人员建立一个用于诊断CAD的circRNA-miRNA-mRNA三重网络。使用接收器工作特性(ROC)曲线评估了hsa-miR-21-3p和hsa-miR-296-3p、circYOD1的预后价值。circ-YOD1的ROC曲线下面积(AUC)为0.824,hsa-miR-21-3p的AUC为0.731,hsa-miR-296-3p为0.776。因而在对cad中circRNA-miRNA-mRNA的三重调控网络的研究表明,hsa-miR-296-3p在潜在生物标记的研究过程中有着及其重要作用 [
FOSL1 (Fos样抗原1,也称为Fra-1)是FOS家族的成员,它由四个基因成员c-FOS,FOSB,FOSL1和FOSL2组成,所有这些基因编码包含亮氨酸拉链的蛋白质。与Jun (c-jun, junB, junD),激活转录因子(ATF)和肌腱膜纤维肉瘤(MAF)结合的FOS是激活蛋白1 (AP-1)复合物的成员。FOSL1是调节正常细胞生长,分化和凋亡的重要核转录因子。在宫颈癌发病机制的最新研究中,研究人员发现Fra-1抑制宫颈癌细胞的增殖,同时还促进细胞凋亡并影响细胞周期分布。此外,Fra-1上调子宫颈癌细胞中的STAT1表达并调节p53信号通路活性。Fra-1的过表达通过改变HeLa细胞中的sirtuin 1 (SIRT1)表达来抑制细胞衰老,而Fra-1的过表达恢复了线粒体疾病并抑制了HeLa细胞中的代谢重编程。STAT1沉默会削弱Fra-1对宫颈癌细胞生长的抑制作用,而STAT1的敲低则逆转了由Fra-1引起的HeLa细胞对细胞衰老和线粒体功能障碍的影响。STAT1沉默也恢复了子宫颈癌细胞的代谢重编程。其研究结果表明,Fra-1通过STAT1介导的p53信号通路调节来抑制子宫颈癌细胞的生长和Warburg效应 [
LNC_002514在目前的研究中尚未有明确的研究结果,通过生物信息学分析结果可知LNC_002514与hsa-miR-296-3p及其下游基因FOSL1存在可能的调控关系,因而可作为潜在的研究方向。
在本次检测结果中,FOSL1的表达量与预期结果相反,因而有如下可能:1. 在组织切取过程中因癌组织与癌旁组织边界不明显、难以准确区分,所以所取得的样品可能不完全是胶质瘤组织,故而检测结果与理论依据不符。2. 本次测序样本容量较小,因此可能无法准确展现FOSL1在恶性胶质瘤中的表达特点。
本研究通过RNA-seq和生物信息学分析,筛选出了在四例脑胶质瘤样本中差异表达的lncRNA106种,上调表达52种,下调表达54种;差异表达miRNA15种,上调表达8种,下调表达7种;这些非编码RNA主要参与有机循环化合物代谢过程、胞内运输、细胞蛋白质定位、蛋白质的运输、有丝分裂细胞周期、细胞周期调节、DNA代谢过程的正调控、水解酶活性的调节等生物过程。并且根据lncRNA、miRNA、mRNA的靶向关系建立了ceRNAs调控网络,在此基础上提出了LNC_002514-hsa-miR-296-3p-FOSL1轴向调控的可能性,并对其作出简要分析。上述nc-RNA的筛选及调控轴向的提出将为以后脑胶质瘤相关研究提供新的方向。
感谢王仕超师姐提供的数据支持,感谢导师张焱如教授在各个方面无微不至的照顾与帮助,感谢舍友为我提供了安静的写作环境,感谢父母多年来的养育与经济和精神支持,感谢男友的支持与安慰,谢谢大家!
内蒙古自治区自然科学基金项目(2017MS0307)。
李明扬,王仕超,凌 宇,刘春霞,曹俊伟,张焱如. 影响人脑胶质瘤细胞发生、增殖关键lncRNA、miRNA的筛选与分析 Screening and Analysis of Key lncRNA and miRNA Affecting the Occurrence and Proliferation of Human Glioma Cells[J]. 亚洲肿瘤科病例研究, 2021, 10(01): 1-23. https://doi.org/10.12677/ACRPO.2021.101001