阳光肺科

 找回密码
 立即注册

微信扫码登录

搜索

[肿瘤基础] 【PCAWG-4】Patterns of somatic structural variation

[复制链接]
肺外学徒 发表于 2020-3-4 00:00:00 | 显示全部楼层 |阅读模式

马上注册,阅读更多内容,享用更多功能!

您需要 登录 才可以下载或查看,没有账号?立即注册

×

a7c9bd4bbe698e35c7be603d1d161ff3.jpg

继续PCAWG的第四篇《Patterns of somatic structural variation in human cancer genomes》;结构变异(SV)作为体细胞突变的一种重要类型,其涉及的范围可从单个基因到全部染色体,因此在目前2658个泛癌种WGS数据基础上,全面鉴定、分析分类结构变异势必较以往更为全面;
但同时,某些类型的SV(例如:等臂染色体,大范围高度同源序列的重排)难以用short-read测序检测出来,因此暂不讨论;此外本文分析只考虑体细胞SV,并排除逆转录事件。

1
Classification of structural variants
- 高度概括而言,SV表现为基因组中两个"breakpoint"连接起来;
Extended table 1. SV关键词的解释

fb84c8f4bed7a827260ad62ab9707dcd.jpg

df8be6280f29b30c4ef1040a59dc41eb.jpg

- 将所有SV从两方面考虑进行分类:1、breakpoint的数量(simple 或 complex);2、重排过程中拷贝(cut-and-paste 或 copy-and-paste)
- cut-and-paste:就像现有的基因组片段进行重新洗牌或丢失;
- copy-and-paste:在重排过程中存在基因组模板拷贝插入;

01bb76e7f44979ef1dc1c4415d9d4be5.png

- 上图是simple SV的各个类型;
- Balanced/Reciprocal与unbalanced置换的区别则在于两个breakpoint之间是否互相补救了,而unbalanced置换因此产生了拷贝数上的变化;



67841ff4aac35d7077077747b8b0cf89.png

- 上图是complex SV的各个类型;
- 其中chromoplexy与chromothripsis在前面已经介绍过;

2
Annotation of structural-variant classes

4e2534d25e481c4f30e73f764d04d439.jpg

- 上图是所有癌种中不同类型SV的violin图,根据平均SV breakpoint数量进行降序排列,右上角则是每个癌种的样本数;
- Deletion是最常见的,其后是串联重复、不平衡易位;
- Reciprocal易位和reciprocal倒置则相对少见;

b058503f0aba257fa81e3eb5d807773c.png

- 如上图的食管腺癌以及卵巢腺癌为例,即使是在同一个癌种中,不同样本的SV类型数量及分布差异巨大

ac30d79114a71c0c7a46207da68a27d9.png

- 从肺癌样本的SV数量及分类图来看,总体上deletion和串联重复是最常见的两种SV类型;
- 肺癌的SV数量在所有癌种中处于中等偏上水平(肺鳞癌第7,肺腺癌第12);




3Cycles of templated insertions- 在探索含有2~10个SV的cluster区域中,新发现了一种模板插入的类型,由不同染色体上的拷贝数扩增的片段连接一起组成;而且这些在单个衍生染色体中的不同片段组成的template极有可能是同时发生的,原因如下:(1)发现了这一SV cluster的转录本;(2)long-read测序数据证实该片段连续;(3)在克隆进化时间分析更支持该模板的片段SV同时发生;(4)在该模板上,不同片段的拷贝数趋于一致;

- 进一步分析这一类型的模板插入,可分为三种类型:cycle,chain与bridge,其中chain的模板并不插入回original染色体,chain与bridge则相反,具体如下:


Cycle of templated insertions
857adb3eaf4634bdeae0d113555df0f1.png

- Cycle:host链中的片段进行复制,从而完成一个类型闭环的模板;共发现1,467种;

Bridge of templated insertions

c27903df02a3391388f251f4aec68053.png

- Bridge:形成的模板插入回host链形成的缺口,就像是两岸的桥梁;共发现1,275种;


Chain of templated insertions
ca93599de0030fe0be94e2397dd0dc9f.png

- Chain:不同染色体上片段形成一条链条式的模板,共发现285种;



4Templated insertions that affect TERT- 结构变异可以通过多种方式影响肿瘤基因,例如:影响基因拷贝数变化、干扰肿瘤抑癌基因、形成融合基因以及将某个基因的编码序列与另一个基因的调控装置并列;
- 发现在很多肝癌中,cycle模板插入都影响着TERT的功能,如下图两例肝癌:

7a5b857d752acbc456131fbbaf02ffa9.png

- 54%的肝癌都存在TERT基因启动子区域的点突变,另外5~10%则是由于结构变异而影响TERT的功能;
- 在30例因SV导致TERT功能异常的肝癌中,10例是模板插入事件,其中绝大多数是cycle,都是引起了TERT的拷贝数增加,连同一些调控元件等;
- 这也因此看得出来,这种新确认的模板插入事件确实有其独特之处;

997643eb4a21ffc6a58c8135617ae972.jpg

- RB1,作为抑癌基因,在肿瘤中其经常直截了当的缺失突变导致失活;但这其中也存在模板插入导致其失活,如上图所示;



5Local n-jumps and local-distant clusters- 仍有许多局限在一个基因组区域内,包含2~10个SV的cluster难以解释其原因;有2个重排,甚至发现3个,4个,统称为local n-jumps,如下图所示:

3b73ab13b473cb414aafec29e8eb5509.jpg

- 除此以外,有一些local jump与远处基因组的某段区域结合起来,称为local-distant cluster,如下图:

2998dad5c4d2025dda8b0657e8e0766e.png

- 以上两种形式的SV cluster,在某些情况上,插入的片段位于断裂点远端,可能是在DNA修复过程中,同一片区域内的DNA片段同时断裂产生(cut-and-paste);在另外一些情况下,插入的片段位于断裂点的近端并经常伴有拷贝数的扩增,这就难以解释为cut-and-paste了,拷贝数的扩增代表了原本模板进行了扩增,而并非简单地重新分布排列的问题,因此copy-and-paste或许更为合理;



6Copy-and-paste patterns of clusters- 在包含2~10个SV的cluster不同模式中,发现都具有类似的形态特征:(1)在单个衍生染色体中分布;(2)拷贝数的低水平增加,特别是2倍和3倍;(3)反向重排明显多于非反向;(4)所发生的染色体拷贝数与肿瘤整体接近;以及(5)断裂点之间紧密接近(通常<1Mb)。因此以上的形态特征都与 chromothripsis,chromoplexy 或repeated breakage–fusion–bridge cycles不同,难以解释;因此目前更倾向于认为,这些局部复杂的SV cluster,同时具有低水平的拷贝数增加,是通过简单的copy-and-paste完成。也就是说,基因组模板的copy是这些cluster的一个内在方面,额外的拷贝插入到产生的衍生染色体中。若其基因组模板都是来源与局部区域,那也就是上述的local n-jump,断裂点的紧密聚集、SV phased、频繁的拷贝数增加以及反向和非反向断点连接的混合。反之,若其基因组模板复制片段来自整个基因组,那么就是chain,cycle或bridge模板插入。


7Genomic properties of structural variants
- 在同一癌种内,缺失或模板插入的DNA片段大小分布是分散的,并无正态分布,如下图:

5f4fb8c48143f17f86a6afd365ee27a6.jpg
- 但是当我们从同一个样本里看,也就是同一患者肿瘤内,则会出现正态的分布,如下图:

39159501adda8caccc77469697396878.jpg

7c83d107b042bcba6f41e19a3cf9b20c.jpg

- 上图是进一步从一个一个模板插入内的不同片段大小分布来看,我们可以看出两个特征:一、其中一个模板与另一个模板的大小关联(a图);二、在一个模板插入中,似乎总有一个小片段相连(<1kb);
- 而这个特征不仅在模板插入中,在local n-jump中也是如此,如下图:
fdda9f12d5092d5392921badcc8b284f.jpg


- 基因组的特征,例如复制时间、转录活性和染色质状态,这些与SV之间的关系尚不清楚;
- 下图是总结了各种类型的基因组特征(列)与不同类型的SV(行)之间的关系:

604645c94882f14fefd23f9c0234e079.jpg

- 其中关联最明显的是复制时间,缺失富集在复制后期区域,而串联复制和不平衡易位在富集在早期复制区;



8Signatures of structural variations- 将所有基本的SV形式根据其片段大小、复制时间和是否在脆弱位点进行标签分类,下图是最常见的12种:

3b8c8ae3b24b160fd0301d7cab4dfd6e.jpg

- Deletion根据片段大小分为3个signature,其中以50-kb,500-kb作为分界点;并且发现small平衡倒置(<100-kb)集中在small del(<50-kb),而large平衡倒置(>100-kb)集中在large del(>500-kb),这证明了两者的关联性,同时也验证了前文的观点
- 在串联重复(TD)中,根据片段大小及复制时间分为5个signature;值得注意的是chain,cycle以及bridge模板插入都集中在早期复制的TD标签中,而local 2-jump则相对集中在晚期复制TD中;而这都印证了copy-and-paste的模式
- 其中一种标签则是以deletion与TD位于染色体脆弱位点(fragile site),其中TD多分布于边缘位置,deletion多分布中心位置;
- 不平衡转换自成一个signature,证明了其在肿瘤基因组中的独特过程



9DNA repair genes and tumor type- 将上述的SV标签与目前已知的致病胚系基因突变进行关联分析,如下图所示:


2f5543a805155437f8f2bfe4689a3a2b.png

- 如上图所示,BRCA1与small TD有关;CDK12可预测mid-large TD;BRCA2PALB2则都与small del和平衡SV有关


- 不同癌种,甚至是同一癌种内的不同个体间的SV标签比例存在巨大差异,如下图:

ad0161e65bf6499c6490b2e087362cee.png

- 灰色代表每个样本的SV事件总数;第二列则代表着该样本SV标签比例;
- 较其他癌种而言,前列腺癌更多出现chromoplexy;肺鳞癌则更多见fold-back倒置;

微信扫二维码转发分享

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

给我们建议|手机版|阳光肺科 ( 粤ICP备2020077405号-1 )

GMT+8, 2025-2-20 14:52

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表