日前,我校林学与风景园林学院2015级草业科学专业学生汪伟旭以共同第一作者在国际期刊《Molecular Cancer》(2019 IF :10.679,IF 5 year:7.898)发表题为“Pan-cancer analysis identifies telomerase associated signatures and cancer subtypes”(https://doi.org/10.1186/s12943-019-1035-x)的论文。其中,我校汪伟旭同学、辛辛那提大学的罗镇华博士以及哈佛大学的李锋博士共同为该论文的第一作者;中山大学数据科学与计算机学院戴智明副教授与生命科学学院熊远妍副教授共同为该论文的共同通讯作者。
该论文认为,癌细胞通过端粒维持机制变得永生化,例如端粒酶逆转录酶(TERT)激活。除了维持端粒长度,TERT还激活多种细胞存活信号传导途径。然而,癌症中端粒酶相关基因的特征仍然难以捉摸。课题组使用癌症基因组图谱(TCGA)的多维数据对TERT高低表达癌症进行了系统分析,结果发现:TERT高表达特异性mRNA表达特征与癌症类型的细胞周期相关共表达模块相关;细胞周期模块中hub基因的实验筛选表明TPX2和EXO1是端粒酶活性和细胞存活的潜在调节剂;miRNA分析显示,TERT高表达特异性miR-17-92簇可以靶向富含TERT低表达癌症的生物过程,并且其表达与肿瘤/正常端粒长度比率呈负相关。有趣的是,TERT高表达癌症倾向于在细胞外基质组织基因中发生突变并扩增MAPK信号传导。通过挖掘药物靶点数据库,发现了许多TERT高表达癌症中特异性体细胞突变,拷贝数增加和含有治疗靶标的高表达基因。最后,一个整合端粒酶相关多组学特征的随机森林分类器确定了两种癌症亚型,显示端粒酶活性和患者存活率存在显着差异。该研究结果描绘了癌症中端粒酶相关的分子景观,并为癌症治疗提供了治疗机会。
汪伟旭在校期间受试验统计学、遗传学、草业生物技术、牧草育种学等课程影响,对高维统计,模式识别以及机器学习在癌症数据上的应用有着浓厚的兴趣,于2016年下半年参与该课题研究,参与期间主要负责该项目的统计分析部分,包括利用权重得分倾向性匹配模型,共表达网络模型以及基于随机森林的无监督聚类模型等对数据进行系统分析。目前汪伟旭已推免至复旦大学生物统计系攻读硕士研究生,研究方向为单细胞组学和计算生物学。(文 林学与风景园林学院 张建国 孔晓娟)
(责任编辑:费思迎)