马上注册,阅读更多内容,享用更多功能!
您需要 登录 才可以下载或查看,没有账号?立即注册
×
2月6日,《Nature》及子刊同时发表了以ICGA及TCGA为基础的全基因组泛癌分析(Pan-Cancer Analysis of Whole Genomes, PCAWG)联盟进行的迄今为止最全面、最雄心勃勃的癌症基因组分析;来自4大洲共744个附属机构的跨学科科学家小组参与到其中,共进行了2658例癌-配对正常组织全基因组测序,覆盖38个癌种,其中1188例具有转录组信息;《Nature》主刊发表的6篇论文,分别从6个不同的侧重面进行结果报告,今日介绍的第一篇《Pan-cancer analysis of whole genomes》,正是对
对PCAWG数据进行全面概述。
各癌种数量的分布如下表,其中肺鳞癌48例,肺腺癌38例;
由于论文信息量巨大,涉及多学科专业内容交叉,因此本文将着重于数据结果上的展示。
01PARTPan-cancer burden of somatic mutations- 从质量良好(white list)2583例中,共检出43,778,859 单核苷酸变异(SNVs), 410,123多核苷酸变异(MNVs),2,418,247 插入/缺失(indels), 288,416 结构变异(SVs),19,166 逆转录事件, 8,185 de novo 线粒体DNA突变; - 不同癌种的体细胞突变负荷具有较大异质性(上图);目标关注肺癌上,肺鳞癌(右边数起第2列)及肺腺癌(右边数起第4列)均位于中上水平;在SNVs、indels及SVs上,两者发生率似乎相当,鳞癌稍多;而在逆转录事件中,肺鳞癌发生率则明显多于肺腺癌; - 年龄与突变负荷存在相关性 (大约190个SNVs/年, p=0.02; 22个indels/年, p=5×10−5; 1.5个SVs/年, p<2×10−16);
02PARTPanorama of driver mutations in cancer
- 在91%的肿瘤都可以找到至少一个驱动基因事件,平均4.6个(从上图可清晰看到不同类型的驱动基因事件发生率及平均数); - 值得注意的是,发生在非编码区域的驱动点突变有25%,其中三分之一影响着TERT启动子区域(TERT基因编码端粒酶逆转录酶,在肿瘤细胞中异常活化,维持染色体的长度及稳定性); - 上图展示了至少65个肿瘤发生突变的基因,不局限于驱动基因;其中可以看到肺鳞癌TP53、CDKN2A多见,肺腺癌则更为均匀; - 上图则展示了一个颇有意见的结果,发生在抑癌基因上的驱动基因事件,两次打击(失活)的现象比较多见;例如TP53而言,77%是两条等位基因均变异导致失活,而形式上则以一条出现缺失,另一条发生点突变多见; - 总体上,17%的病例存在少见的germline蛋白截断突变(PTVs),而4.5%则进一步发生体细胞变异导致两条等位基因失活,这也是我们所熟悉的二次打击学说; - 81%的二次打击情况发生在我们已知的肿瘤易感基因上,如BRCA1,BRCA2以及ATM;
03PARTPCAWG tumours with no apparent drivers
- 尽管超过90%肿瘤存在至少一个驱动基因事件,但仍有181例肿瘤没有找到; - 首先从标本质量上解释,有4例配对的正常标本存在超过5%的肿瘤DNA; - 其次,小部分的标本的检测灵敏度平均70~90%,尤其是对于肿瘤细胞含量低的标本;
- 再者就是部分的驱动基因位点测序深度不足,例如仅有一半左右的标本测序足够覆盖TERT启动子区域(可能是由于该区域高GC含量导致); - 或者是由于生信算法的技术原因; - 或者就真的是由于目前对部分肿瘤相关基因仍然认识不足;
- 对这一批无驱动基因事件的肿瘤进一步探索,髓母细胞瘤中SETD2这一基因重复出现拷贝数变异; - 此外,在无驱动基因事件的肿瘤中一个显著的特征就是染色体非整倍性;这似乎提示着,在无已知的驱动点突变/融合/拷贝数变异的情况下,染色体loss/gain的组合就足以导致肿瘤发生; - 尽管经过以上种种的分析,仍有5.3%的肿瘤缺少驱动基因事件,目前仍无法解释! 04PARTPatterns of clustered mutations and SVs
在肿瘤基因组中,存在一些体细胞突变过程是短时间内发生的,所导致基因变异结局堪称灾难性,这与我们平常所认识的“循序渐进”的过程截然不同; - chromoplexy:染色体复杂重排,顾名思义,复杂的染色体间区域重排; - kataegis:来源于希腊语“暴风雨”的意思,在基因组小范围局部区域内,发生大量突变,导致局部核苷酸替换,大多发生在单条DNA链; - chromothripsis:染色体碎裂,在一条或几条染色体上,数十到数百个DNA同时发生断裂,并随机地连接在一起;
- 17.8%的样本出现chromoplexy,其中以前列腺癌、淋巴瘤以及甲状腺癌;上图展示了chromoplexy的cicos图; - 在48例甲状腺癌中,出现13次融合基因事件,其中8例是由于chromoplexy直接或间接导致; - 60.5%的肿瘤出现kataegis,尤其是肺鳞癌、膀胱癌、肢端黑色素瘤以及肉瘤;
- 81.7%的kataegis是由于APOBEC突变标签所致,并与APOBEC3B表达水平、体细胞SV负荷以及诊断年龄相关; - 22.3%的肿瘤发生chromothripsis,多见于肉瘤、胶质母细胞瘤、肺鳞癌、黑色素瘤以及乳腺癌; - 在大多数癌种中,chromothripsis的发生常导致基因组扩增,最常见的是TP53; - chromothripsis区域与3.6%的驱动基因以及7%拷贝数变异事件共同出现; - chromothripsis导致的驱动基因事件中,扩增占58%,其次是纯合子缺失(34%)以及基因或启动子区域内的SVs(8%); 05PARTTiming clustered mutations in evolution肿瘤基因组突变事件的发生时间顺序是极为重要的;一个考量就是克隆突变和亚克隆突变,克隆突变早于亚克隆突变;另一个考量就是,在拷贝数增加的区域中,分子事件可以根据突变是在拷贝数增加之前(拷贝数随之增加)还是发生在增加之后(只有一个拷贝)来进一步划分; -相对于chromoplexy、kataegis而言,chromothripsis更多的是克隆事件,这说明了它发生在肿瘤进化的早期,在脂肪肉瘤、前列腺癌及肺鳞癌多见; - 在3例发生扩增性chromothripsis肢端黑色素瘤中,我们可以根据chromothripsis区域中SNV的VAF(等位基因频率)来判断两者发生的先后顺序;若SNV发生在chromothripsis前,则其VAF则随着扩增而增高,反之亦然;
06PARTGermline effects on somatic mutation- 首先,在泛癌种的水平上,进行germline常见位点的肿瘤相关GWAS分析(最小等位基因频率MAF>5%);最终发现22q13.1这一区域与APOBEC3B的mutagenesis作用具有相关性; - 22q13.1中以rs12628403这一位点的作用最为突出,与APOBEC3B的mutagenesis水平具有明显相关性; - 此外,在22q13.1中,新发现了rs2142833这一位点,其与APOBEC3B的mutagenesis水平同样具有相关性; - 在欧洲及亚种人群集中, rs12628403与rs2142833的遗传是相互独立的; - 随后进行少见germline变异位点(MAF<0.5%)与体细胞SVs的关联分析; - 可以发现BRCA2 PTVs与SV deletion相关;而BRCA1 PTVs则与SV串联重复相关; - BRCA1 PTV与模板插入循环表型呈现强相关 (p=4×10−15); - 通过全基因组长片段测序结果中,在BRCA1缺失前列腺癌中,可观察到小串联复制和模板插入循环的SV表型; - 模板插入循环,是一种复杂的SV事件,由来自人体基因组循环复制DNA模板组成,连接到一个连续的序列中,然衍生插入到染色体中; - 在BRCA1突变肿瘤中,绝大部分都出现了(20/21)小串联复制和模板插入的SV表型,这说明了BRCA1的双等位基因失活驱动着模块插入结构变异表型; - 在少见germline变异位点关联分析中,可以看到MBD4基因与CpG二核苷酸区域中C>T突变率有关; - TCGA上的数据同样证实了germline的MBD4基因 PTV与CpG二核苷酸区域mutagenesis作用具有相关性 (p=7.1×10−4); - L1元件:是现今人体内存在唯一具有自主转座活性的转座子;L1元件通过转录和逆转录在内的转座过程产生新的DNA拷贝,并使新产生的DNA拷贝插入基因组的不同位置,影响基因组中其他基因的表达和调控,从而导致基因疾病或肿瘤的发生;
- 在PCAWG数据集中只检测到16个L1元件(占目前已知67%);
07PARTReplicative immortality肿瘤细胞的重要标志之一正是其逃避细胞衰老的能力。正常的体细胞的细胞分裂潜力是有限的,而端粒磨损是限制有丝分裂数量的一种重要机制。 肿瘤细胞具有多种策略来避免端粒磨损的问题,其中最普遍的就是TERT的过表达,其作为端粒酶逆转录酶可以有效维持端粒长度;其次是“端粒延长替代”通路(ALT通路),由ATRX和DAXX基因的功能缺失突变介导同源重组延长端粒; - 在PCAWG数据集中,16%的肿瘤存在TERT、ATRX及DAXX中至少一种突变; - 根据TERT及ALT通路的突变模式的12个特点进行聚类,发现其模式可分为4个子集(上图a); - 子集C1和C2主要以ALT通路为主,肉瘤多见于C1,而胰腺内分泌肿瘤及低级别胶质瘤多见于C2; - 子集C1中ATRX与RB1突变是互斥的,正如以往研究所示,在TERT野生型和ATRX失活的情况下,RB1突变与端粒的长度有关;这提示着RB1突变有可能是ALT通路激活的另一相关机制; - 子集C3则以TERT为主,甲状腺癌多见于此集;
Conclusion
最后的总结,我想直接引用文中的一句话: A major barrier to its evidence-based implementation is the daunting heterogeneity of cancer chronicled in these papers, from tumour type to tumour type, from patient to patient, from clone to clone and from cell to cell.
肿瘤循证医学的发展的一个主要障碍就是癌症的令人望而生畏的异质性,从这一肿瘤类型到另一肿瘤类型,从这位患者到那位患者,从这个克隆到那个克隆,甚至是从这个细胞到那个细胞。
下一步: ICGC-ARGO计划 (https:// www.icgc-argo.org/),建立泛癌种的临床治疗数据与基因库相结合的综合知识库,将故事延续;
|