1.本发明属于胶质瘤技术领域,具体涉及一种长链非编码核糖核酸自噬影响神经胶质瘤的预后模型的构建方法。
背景技术:
2.胶质瘤是脊髓最常见的脑原发肿瘤,占恶性脑肿瘤的80%以上,脑胶质瘤的病理类型主要为星形细胞瘤、少突胶质细胞瘤、室管膜癌和混合性胶质瘤。世界卫生组织的分类系统通常分为4个级别,1级和2级为低级别胶质瘤,3级和4级为高级别胶质瘤,一般来说,分级肿瘤的预后较差。胶质母细胞瘤是最常见、最具破坏性的恶性脑肿瘤,绝大多数患者在2年内死亡,5年生存率小于5%。目前,胶质瘤的标准治疗方法包括最大限度的手术切除肿瘤、化疗和放疗,但在胶质瘤预后方面的疗效有限,中位生存时间为15个月。由于神经胶质瘤治疗的资源有限,需要更多的研究来研究新的方法来对抗这种恶性肿瘤。此外,确定预后指标对有效预测脑胶质瘤患者的os也很重要。
3.长链非编码rna是指包含200多个核苷酸的不编码蛋白质的rna分子。随着生物学和遗传学的快速发展,越来越多的证据表明自噬相关的lncrna在胶质瘤的起始、诱导和进展中起着重要作用。因此,探索与自噬相关的lncrna对胶质瘤的基础研究、临床诊断和治疗具有重要的指导价值和广阔的应用前景。
技术实现要素:
4.基于上述技术问题,本发明提供一种长链非编码核糖核酸自噬影响神经胶质瘤的预后模型的构建方法。
5.其具体技术方案为:一种长链非编码核糖核酸自噬影响神经胶质瘤的预后模型的构建方法,包括以下步骤:s1:筛选与lncrna相关的转录基因样本、筛选与自噬相关的lncrna基因、收集胶质瘤患者的临床os数据,并将以上三组数据合并;s2:利用edger软件筛选与自噬相关的lncrna样本中的差异表达基因,并利用r软件对与自噬相关的lncrna差异表达基因进行kegg和go富集分析,从而确定lncrna的功能和通路;s3:利用单变量和多变量cox回归分析确定自噬相关的长链非编码核糖核酸与独立危险因素之间的相关性;s4:根据s1中合并后的数据利用edger软件筛选42个与神经胶质瘤自噬相关的lncrna,并将其与收集的胶质瘤患者的临床os数据进行重叠,构建神经胶质瘤的预后模型,从而得到36个lncrna与胶质瘤的预后相关;s5:利用roc分析评估lncrna的特征,采用校准曲线评估预测的生存时间与实际生
存时间是否一致,并利用auc验证预后模型的预测性能和准确性;s6:通过生存分析、风险分析和独立的预后分析验证神经胶质瘤的预后模型。
6.另外,本发明提供的上述技术方案中的长链非编码核糖核酸自噬影响神经胶质瘤的预后模型的构建方法还可以具有如下附加技术特征:在上述技术方案中,在步骤s1中,通过收集1114例胶质瘤患者的临床数据,使用生存分析比较高危组和低危组的生存率,计算胶质瘤患者的风险,并确定胶质瘤患者的os,从而得到胶质瘤患者的临床os数据。
7.在上述技术方案中,在步骤s2中,使用edger软件,通过利用修正的p值和错误发现率识别具有统计学意义的靶基因,纠正假阳性,再去除没有相应基因名称的探针集或具有多个探针集的基因,从而筛选出与自噬相关的lncrna样本中的差异表达基因。
8.在上述技术方案中,对胶质瘤患者的临床特征和风险值进行临床相关性分析。
9.在上述技术方案中,在36个与预后相关的lncrna中,有22个lncrna基因在胶质瘤细胞中高表达、14个lncrna基因在胶质瘤细胞中低表达。
10.在上述技术方案中,在lncrna中,casp8、nrg1、itga3和vmp1均影响胶质瘤患者的预后,其中casp8与胶质瘤患者的os相关。
11.本发明的一种长链非编码核糖核酸自噬影响神经胶质瘤的预后模型的构建方法,与现有技术相比,通过筛选42个与胶质瘤自噬相关的lncrna基因,并将其与收集到的胶质瘤患者的临床os数据进行重叠,构建预后模型,获得了36个与预后相关的lncrna;并对36个预后相关基因进行了os分析。发现lncrna对os降低风险较高的胶质瘤患者的预后具有重要意义。通过roc分析验证了自噬相关lncrna胶质瘤预后模型可以指导胶质瘤患者的靶向治疗策略,降低死亡率和复发率,提高患者的生存期和预后。
附图说明
12.图1为本发明的步骤流程图;图2为本发明的热图和火山图;图3为本发明的箱形图;图4为本发明的氧化石墨烯富集分析图;图5为本发明的kegg富集分析图;图6为本发明的36个与预后相关的lncrna图;图7为本发明的神经胶质瘤患者临床总生存期os数据的kaplan-meier生存曲线图;图8为本发明筛选后获得的13例胶质瘤的自噬相关lncrna风险曲线图;图9为本发明神经胶质瘤患者多指标roc曲线评估模型的可行性分析图;图10为本发明的神经胶质瘤模型的单因素独立预后分析和多因素独立预后分析图;
具体实施方式
13.下面结合具体实施案例和附图1-10所示对本发明作进一步说明,但本发明并不局限于这些实施例。
14.一种长链非编码核糖核酸自噬影响神经胶质瘤的预后模型的构建方法,包括以下步骤:s1:筛选与lncrna相关的转录基因样本、筛选与自噬相关的lncrna基因、收集胶质瘤患者的临床os数据,并将以上三组数据合并;s2:利用edger软件筛选与自噬相关的lncrna样本中的差异表达基因,并利用r软件对与自噬相关的lncrna差异表达基因进行kegg和go富集分析,从而确定lncrna的功能和通路;s3:利用单变量和多变量cox回归分析确定自噬相关的长链非编码核糖核酸与独立危险因素之间的相关性;s4:根据s1中合并后的数据利用edger软件筛选42个与神经胶质瘤自噬相关的lncrna,并将其与收集的胶质瘤患者的临床os数据进行重叠,构建神经胶质瘤的预后模型,从而得到36个lncrna与胶质瘤的预后相关;s5:利用roc分析评估lncrna的特征,采用校准曲线评估预测的生存时间与实际生存时间是否一致,并利用auc验证预后模型的预测性能和准确性;s6:通过生存分析、风险分析和独立的预后分析验证神经胶质瘤的预后模型。
15.通过筛选42个与胶质瘤自噬相关的lncrna基因,并将其与收集到的胶质瘤患者的临床os数据进行重叠,构建预后模型;获得了36个与预后相关的lncrna;并对36个预后相关基因进行了os分析,具体如图7所示。发现lncrna对os降低风险较高的胶质瘤患者的预后具有重要意义。通过roc分析验证了自噬相关lncrna胶质瘤预后模型可以指导胶质瘤患者的靶向治疗策略,降低死亡率和复发率,提高患者的生存期和预后。
16.具体地,如图7所示,lncrna高表达患者的生存率为1年生存率50%、3年生存率0%、5年生存率0%与lncrna低表达患者的生存率显著不同,lncrna低表达患者的生存率为1年生存率100%、3年生存率90%、5年生存率40%,p 《 0.001。其中神经胶质瘤患者临床总生存期os数据的kaplan-meier生存曲线。p 《 0.05为有显著差异,p 》 0.05为差异不显著。
17.在本发明的实施例中,根据相应的基因序列将与lncrna相关的转录基因样本、与自噬相关的lncrna基因、胶质瘤患者的临床os,以上三组数据合并,利用r软件得到42个与自噬相关的重叠lncrna进行进一步分析,其中包括下调基因28个,上调基因14个;如图2所示,a为与自噬相关的lncrna的热图,b为与自噬相关的lncrna的火山图。
18.在本发明的实施例中,用箱线图分析854个lncrna转录本样本,使用r软件中的“ggpubr”软件包识别差异基因的表达水平,创建与自噬相关的lncrna箱线图;如图3所示,横坐标为42个差异lncrna基因的名称,纵坐标为这些基因的表达情况。且在神经胶质瘤样本中42个差异表达的自噬相关lncrna中发现了14个上调基因和28个下调基因;在本发明的实施例中,如图4所示,a中纵坐标为go项名称,横坐标为每个go项富集的基因数量,直方图颜色表示go的富集程度。这些基因主要集中在细胞凋亡和自噬的调控机制中,包括巨自噬细胞、自噬小体、自噬小体的某些组织、调节自噬细胞和调节巨噬细胞。b中纵坐标为-log,横坐标为z分数;az分数》0表示go期富集的上调基因数量较多,z分数《0表示go期富集的上调基因数量较少。由图可知,在go条目中富集的大部分基因表达下调,包括go:0007033、go:0000421和go0000407;本技术鉴定了go术语count = 10,显示这些degs最显著富集,包括go: 0061912,go: 0016241和go: 0010506,深色颜色表示更丰富的基因。
c中该分析的结果与之前的barplot分析的结果一致。d中本技术从氧化石墨烯热中筛选出的基因主要富集于液泡组织、通过死亡结构域调控子的外部凋亡信号通路和外部凋亡信号通路等方面。
19.具体地,a为42个自噬相关lncrna基因的go富集分析barplot,其中红色代表高度富集信号通。b为氧化石墨烯富集分析气泡图。c为go富集分析,其中计数数= 10。d为富集信号通路的热图,其中深色表示富集信号通路更强烈。
20.在本发明的实施例中,如图5所示,a中的横坐标为基因数量,纵坐标为信号通路名称。他的颜色越深,基因的富集程度就越高。通过该数据发现自噬-动物、自噬-其他和nod样受体信号通路等通路在kegg通路中表达最为显著的。b中横坐标为基因数比,纵坐标为kegg信号通路名称,气泡颜色为基因富集度。通过该数据发现kegg信号通路显著富集,包括自噬-动物、自噬-其他和nod样受体信号通路。在这些途径中,自噬途径最为丰富。且肿瘤相关基因与自噬信号通路诱导通路之间存在一定的相关性。c中大多数富集的kegg通路下调了基因。d中筛选的自噬相关lncrna在自噬动物、自噬其他和nod样受体信号通路中高表达。
21.具体地,a为42个自噬相关lncrna基因的kegg富集分析barplot。b为42个自噬相关lncrna基因kegg富集分析的气泡图。c为富集信号通路的圆形图,其中计数数= 10。 d.为富集信号通路的热图,其中深色表示信号通路更丰富。
22.使用r软件中的“survivalroc”软件包进行roc分析来评估lncrna的特征。采用校准曲线评估预测的生存时间是否与实际生存时间一致,并采用auc验证预后模型的预测性能和准确性。此外,通过单变量和多变量cox比例风险回归分析验证了神经胶质瘤的预后模型。本发明还对患者的临床特征和风险值进行了临床相关性分析,分析了优化后的13个风险基因,以及风险值和临床特征是否存在相关性。
23.具体地,通过从癌症基因组图谱中下载了854例长链非编码核糖核酸转录本样本和1114例胶质瘤患者的临床数据,从www.autophagy.com中下载了232个自噬相关基因。并进行了kegg和go富集分析,以确定信号转导通路的风险特征和生物信息学功能。利用单变量和多变量cox回归分析用于确定自噬相关的长链非编码核糖核酸与独立危险因素之间的相关性。采用roc来评估预后模型的可行性。最后,进行生存分析、风险分析和独立的预后分析来验证脑胶质瘤的预后模型。
24.具体地,利用该预后模型发现36种与自噬相关的长链非编码核糖核酸与神经胶质瘤患者的总生存率相关,且在roc曲线下的面积与校准曲线下的面积高度相似,并通过单变量和多变量cox回归分析表明,自噬相关的长链非编码核糖核酸是神经胶质瘤的独立预测因子,因此自噬相关的长链非编码核糖核酸会影响神经胶质瘤患者的发生发展和预后,进而神经胶质瘤的预后模型在神经胶质瘤的治疗中具有潜在的应用价值。
25.具体地,kegg是主要用于评估高通量实验中产生的大量分子数据。本发明通过使用kegg来评估相应的lncrna的高水平生物学功能。此外,我们使用go富集分析来解释和分析这些基因的生物学过程。并下载了相应的基因id、基因表达数据和logfc值。利用富集软件包生成一个可视化的基因集富集图谱,其中,p=为0.05为富集的氧化石墨烯的过滤条件。在生成go富集气泡图之前,先设置宽度=10、高度=8和
−
log》3来显示相应基因的id。最高的错误发现率)《 0.05被认为有统计学意义。最后,利用r软件对差异表达的自噬相关lncrna进行kegg和go富集分析,确定了这些lncrna丰富的功能和通路。
26.具体地,roc分析是使用独立的危险因素来检测生存预测的敏感性和特异性。roc曲线下auc范围为0.5~1.0,auc越接近1,模型的预测能力越准确;当auc《为0.5时,预后模型没有预测能力。
27.通过对与胶质瘤自噬相关的lncrna预后模型进行了风险分析;计算每个胶质瘤患者的风险值,包括风险评分、生存时间和风险热图;并绘制风险曲线,如图8所示,横坐标为每个患者的风险值、总生存期和生存状态,其中左图为低风险患者,右图为患者。患者的风险值依次增加,神经胶质瘤患者的死亡人数依次增加;研究结果与预后模型的合理性相一致。通过筛选了13个lncrna,并对这13个lncrna的风险热图进行了可视化分析,发现低风险lncrna基因包括bag3,cx3cl1,maplc3,gabarap和sipt2,高危lncrna基因包括itga3、dlc1、vegfa、cd46、vmp1、casp8、casp4和nrg1。
28.具体地,如图10所示,本发明使用构建的cox模型来分析胶质瘤患者的临床资料。发现风险评分、年龄和分级是独立的p《0.001 vs。p《0.001 vs.p=0.002和多变量p《0.001 vs。p《0.001vs.p《0.001预后因素。这三个指标在胶质瘤模型中可以作为独立的预后因素p 《 0.05,而其他临床特征指标在胶质瘤模型中不能作为独立的预后因素p 》 0.05。单因素和多因素cphr分析显示,这三个特征是神经胶质瘤患者的独立预测因素。
29.在本发明的实施例中,在步骤s1中,通过收集1114例胶质瘤患者的临床数据,使用生存分析比较高危组和低危组的生存率,计算胶质瘤患者的风险,并确定胶质瘤患者的os,从而得到胶质瘤患者的临床os数据。
30.在本发明的实施例中,在步骤s2中,使用edger软件,通过利用修正的p值和错误发现率识别具有统计学意义的靶基因,纠正假阳性,再去除没有相应基因名称的探针集或具有多个探针集的基因,从而筛选出与自噬相关的lncrna样本中的差异表达基因。
31.在本发明的实施例中,对胶质瘤患者的临床特征和风险值进行临床相关性分析。
32.具体地,如图9所示,多条曲线代表神经胶质瘤患者的临床特征指标,包括风险值、年龄、性别。其中,以36例胶质瘤患者的预后相关风险值绘制的红色风险roc曲线为主要分析对象。风险值的roc曲线下面积,所建立的预后模型越准确。基于风险值auc = 0.853、临床特征auc 》 0.8和其他临床特征与auc 《 0.8的结果,得出结论,对于胶质瘤的预后模型,本发明使用构建的风险轮廓来预测患者生存比其他临床特征更好。
33.在本发明的实施例中,如图6所示,在36个与预后相关的lncrna中,有22个lncrna基因在胶质瘤细胞中高表达、14个lncrna基因在胶质瘤细胞中低表达。
34.在本发明的实施例中,在lncrna中,casp8、nrg1、itga3和vmp1均影响胶质瘤患者的预后,其中casp8与胶质瘤患者的os相关。
35.在本发明中,发现36个与自噬相关的lncrna与胶质瘤的预后相关。通过kegg和go富集分析结果,几乎所有这些lncrna都参与了自噬信号通路。此外,我们发现在lncrna中,casp8、nrg1、itga3和vmp1对胶质瘤患者有预后价值。且在本发明中,还发现casp8也与胶质瘤患者的os相关。而自噬相关基因参与了重要的癌症通路和自噬通路,为神经胶质瘤的癌症靶向治疗提供了强有力的证据。
36.在本发明的描述中,术语“多个”则指两个或两个以上,除非另有明确的限定,术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定
的方位构造和操作,因此不能理解为对本发明的限制;术语“连接”、“安装”、“固定”等均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
37.在本发明的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本发明中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
38.以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。