马上注册,阅读更多内容,享用更多功能!
您需要 登录 才可以下载或查看,没有账号?立即注册
×
今天继续深入PCAWG系列文章第二篇《The evolutionary history of 2,658 cancers》;在肿瘤组织的bulk全基因组测序中,我们可以通过不同维度的考量来部分重建出该肿瘤个体的进化过程,例如早期进化过程中染色体扩增的次序、配对原发-转移组织中进化分析以及泛癌种驱动基因的时间顺序等;
01PARTReconstructing the life history of tumours- 体细胞进化过程自受精卵开始直至死亡,上图则是不同基因事件early/late以及clonal/subclonal的判断示意图;(MRCA:most recent common ancestor)
- 上图为一例肾透明细胞癌,77岁,男性;在早期中(3p;5q)之间发生不平衡易位,同时5q出现扩增(这一表现在既往研究中也有发现),随后全基因组发生了扩增;所以导致上图的改变,3p的杂合性缺失以及5q区域的双等位基因扩增(top:VAF;middle:CN与SV;bottom:发生时间); 02PARTTiming patterns of copy number gains
- 上图展示的不同癌种之间1-X染色体位置上的拷贝数增加概貌,其中绿色代表early clonal,紫色代表late clonal,连续变量分子时间(molecular time)从0~1,圆圈的大小表示其发生率;
- 染色体水平上的拷贝数增加分子时间在不同癌种之间异质性较大,平均0.6(IQR:0.10-0.87);但似乎在同一个癌种内则表现出较好的相似性;
- 上图中自上而下的顺序是根据总体染色体拷贝数增加分子时间,因此最上两行(胶质母细胞瘤和随母细胞瘤)的染色体拷贝数增加事件绝大多数发生在肿瘤早期;相反地,倒数的几行(肺癌、黑色素瘤和肾乳头状癌)的拷贝数增加则多发生在肿瘤较晚的区间;
- 进一步将目光关注在胶质母细胞瘤上,90%的GBM都存在7/19/20染色体拷贝数增加,而且这些分子事件的发生时间都在前10%; - 如果上面的数据过于空洞,那么这张图就会进一步具体说明胶质母细胞瘤7/19/20染色体拷贝数增加分子时间的早期发生; - a图展示了3例7号三倍体胶质母细胞瘤所有染色体的VAF、copy number及分子时间;b图展示的是比7号三倍体事件发生更早的SNV分布; - 按比例来说,在7号三倍体胶质母细胞瘤病例中,平均600个SNV中,少于3个SNV较7号三倍体事件发生更早; - 更加形象地说,胶质母细胞瘤中7号三倍体分子事件就发生在其前6-39次细胞分裂之内;换句话说,在正常健康的脑组织中就可以检测出来! - 髓母细胞瘤也同样存在类似的现象,17q的拷贝数增加; - 在同一癌种中,染色体拷贝数增加的分子时间是接近的;
- 这一现象或许与全基因拷贝数增加(WGD)有关;但实际上,在近二倍体肿瘤中,只有6%的同时扩增的染色体片段是由于染色体之间的结构变异所引起;也就是说染色体拷贝数增加的分子时间在同一癌种是接近的; - 在近二倍体肿瘤中,57%的肿瘤拷贝数增加是同步的,比随机预期高出61%(p<0.01);
- 80~90%的染色体臂水平的拷贝数增加了1的等位基因水平,这似乎就像是细胞分裂后期错误分离所导致的;此外,85%的2倍拷贝数增加等位片段,第二次的扩增是明显延迟的,这似乎也说明这一猜想;
03PARTTiming of point mutations in driver genes- 点突变包括SNVs、insertions以及deletions;
- 在2583 unique样本共47million点突变中,22%是early clonal,7%是late clonal,53%是unspecified clonal以及17%是subclonal;
- 在453个驱动基因panel中,共鉴别出5913个点突变,其中29%是early clonal,5%是late clonal,56%是unspecified clonal,仅有8%是subclony; - TP53的分子时间发生在early clonal是late clonal的12倍; - 从上图可以看出,TP53的分子时间不同癌种之间存在差别,肺鳞癌而言TP53均是early clonal,而肺腺癌的TP53则不全是early clonal; - KRAS的分子时间发生在early clonal是late clonal的8倍,PIK3CA是2倍,TERT是3倍; - 50%的early clonal驱动突变发生在9个基因中,然后50%的late或subclonal驱动基因发生在35个不同基因上,接近4倍的差距;
- 这表明了,在肿瘤进化早期,分子事件的发生一般就在常见的驱动基因上,而在后期分子事件则极其多样化;
04PARTRelative timing of somatic driver events- 上图是一张分析思路示意图,不同的基因突变,通过两两之间的顺序发生前后事件的概率分布,最终将所有基因分子事件发生次序进行排序; - 例如在一例结直肠腺癌患者中,APC突变发生最早,随后是KRAS、17p拷贝数缺失以及TP53,这符合了经典的结直肠癌APC-KRAS-TP53进化模型; - 于是根据上述示意图的分析思路,将58例结直肠腺癌的所有基因分子事件的先后顺序概率排序,同样可以看到APC-KRAS-TP53进化相对顺序; - 同样地,在c,f图展示的胰腺神经内分泌肿瘤的分子事件顺序排序,可以看到染色体2,6,11,16的拷贝数减少通常在早期发生;而全基因拷贝数增加(WGD)则发生地相对较晚; - 而在脑胶质瘤中,10号染色体缺失以及TP53、EGFR发生较早,而染色体7,19,20的拷贝数增加则相对较晚; - 结合所有癌种来看,似乎存在以下规律:TP53以及17号染色体缺失一般发生较早,WGD在中等水平,大部分的CNV发生较晚,缺失一般先于扩增,常见的驱动基因突变一般先于少见的驱动基因;
05PARTTiming of mutational signature- 上图a,b分别展示着两个mutational signature在肿瘤发展的前后阶段发生明显变化的案例; - 而这种现象并不少见,在early-late clonal期间,29%的肿瘤存在上述的改变,signature图谱差异平均达19%;而在clonal-subclonal期间,30%的肿瘤存在上述的改变,signature图谱差异平均达21%;因此总体上40%的肿瘤会出现在肿瘤发展的前后阶段mutational signature发生明显变化; - 共分析出57种mutational signature,从c,d两图可看出大部分并无明确的变化趋势; - 外源诱因的signature多数集中在early clonal,例如SBS7-UV(紫外线),前后相差0.16倍;SBS4-smoking(肺腺癌的吸烟因素),前后相差0.43倍;此外还有SBS12(不明病原学),前后相差0.22倍; - 在慢性淋巴细胞性白血病中,从clonal-subclonal阶段,SBS9(体细胞高突变相关的突变)相对减少了20倍;
- 在多数癌种中,early-late clonal阶段,APOBEC(SBS2、SBS13)前后增加2倍;此外还有SBS38(3.6倍),错配修复(1.8倍);
06PARTChronological time estimates上述部分关于肿瘤分子事件进化过程都是局限在肿瘤当前诊断时全基因组snapshot分析,或者换句话说只是前后顺序比较,并没有将分子事件放在时间轴上进行; - 尽管肿瘤基因突变速率并非恒定,但可通过先考虑一些内源性、干扰因素较少的突变进行计算评估,来一定程度缓解上述缺陷;例如CpG-to-TpG 突变,5-甲基胞嘧啶脱氨为胸腺嘧啶,这是速率相对稳定的突变,被称为“molecular clock”; - 进一步分析表明CpG-to-TpG的突变速率稳定,接近于正常细胞,因此就可以用来作为参照物的作用;例如上图,一例卵巢腺癌中,我们就可以估计其WGD的分子事件大概在29%水平; - 因此根据上述分析思路,可以通过CpG-to-TpG不同的突变速率就可以估计肿瘤细胞从第一次分裂到MRCA这一段潜伏期的长度,以最右侧卵巢腺癌为例,其潜伏期可以从几年到几十年不等,平均达到10年以上! - 令人惊讶的是,从MRCA到可检测的subclonal而言,其维持的时间就明显较短;
最后就附上肺腺癌与肺鳞癌typical timelines
|