染色体结构性改变是癌基因组的一大特点,常见现象是DNA较长片段的扩增和缺失,也就是常说的DNA拷贝数变异(CNA)[1]。

导致CNA的因素是一些互相存在关联的生物学过程,例如有丝分裂出错,随之而来的复制应激以及断裂-融合-桥循环[2]。

CNA能体现癌细胞染色体不稳定性(CIN)。CIN是一个更广泛的概念,随着疾病进展,CIN会越来越高,引起的基因组变异包括DNA片段缺失和扩增、染色体局部重排、染色体外DNA以及微核的形成[3]。


(相关资料图)

因此,在科学研究中通常将CNA水平、基因组杂合性丢失比例,以及基因组加倍状态用于度量CIN的程度。

然而一直以来,在泛癌水平上研究者们只局限于单一类型的CIN——由一种特定因素引起(例如同源重组缺陷)造成特定的基因组变异(例如整条染色体臂改变),或者是只研究一种癌症类型中的CIN,缺乏在多种癌症中对CIN的多样性及其来源进行系统性描述的研究以及方法[4-6]。

同样的,CNA作为CIN的表现形式,在之前的研究中对其进行特征性描述的方法需要已知的CIN标志物,并且只能依赖于全基因组测序数据,这极大的限制了这些方法的可及性[7,8]。

最近《自然》期刊发表的两篇研究共同解决了上述问题,两篇研究的样本数据均来自TCGA。

由剑桥大学的Geoff Macintyre和Florian Markowetz领衔的研究团队,在包括33种癌型的7880个肿瘤样本中,系统地评估了CIN的程度、异质性和来源,并且提出了一个包含17种与特定CIN类型有关的CNA特征目录[9]。

论文截图

由伦敦大学学院的Nischalan Pillay和加州大学圣地亚哥分校的Ludmil B. Alexandrov领衔的合作团队,提出了一个可应用于多种数据类型的分析癌基因组拷贝数模式的方法,随后将其应用于包括33种癌型的9873个肿瘤样本中,发现其中97%的样本的拷贝数模式可以由21种CNA特征代表[10]。

论文截图

实际上这两个研究的目的较为相似,所以结论有许多一致的地方。两个研究所应用的计算方法原理,均为利用矩阵分解算法对肿瘤样本的基因组拷贝数谱进行分解,最终提取能代表并重建样本拷贝数谱的CNA特征。

在Geoff Macintyre和Florian Markowetz团队的研究中,他们使用一个混合模型在已知的5种CNA特征(可代表不同的CIN来源)基础上,分析了6335(7880个样本中只有6335个样本具有可检测的CIN)个样本的拷贝数谱,最终得到了10个泛癌CNA特征,以及7个癌症类型特异的CNA特征,命名为CX1~17,并且在模拟数据中进行了验证。

接着研究人员根据这些特征代表的拷贝数模式,以及与已知癌症驱动突变的关系,推测了它们的形成原因。在多数情况下,CNA特征的形成机制都是一目了然的,因为其代表的拷贝数模式有明显的特点,例如整条染色体的拷贝数变异。

在敲定了一个CNA特征形成机制之后,他们还会寻求对这个机制的外部数据支持,包括在2个额外的样本队列(PCAWG、ICGC)中进行验证,同时考虑敲定的CNA特征形成机制是否和5种其它类型的突变特征(点突变等)和14种分子特征(基因表达等),以及11种DNA修复特异的特征(BRCA1/2的遗传变异等)吻合。

由于CX1、CX6、CX14所代表的拷贝数模式均与整条染色体(臂)的改变有关,因此研究人员认为它们产生的原因可能是有丝分裂中染色体分离错误。

而CX2、CX3、CX5表现出来的拷贝数模式在之前已被证明与同源重组缺陷有关,并且在携带BRCA1体细胞突变的肿瘤样本中,这三种CNA特征均有较高水平。

CX4则包含一种独特的拷贝数模式——相邻片段之间发生双倍拷贝数变化,这通常是全基因组翻倍导致的。CX10显著富集于携带FBXW7失活突变的肿瘤样本中,因此被认为是非同源末端连接(NHEJ)受损所致。

CX8、CX9、CX11、CX13分别代表了不同水平的DNA扩增,并且富集于U2AF1和MAPK1过表达的肿瘤中,表明这些特征可能起因于复制应激。

CX7、CX12、CX15~17由于没有明显的拷贝数模式,无法判断产生的原因。

我们再来看Nischalan Pillay和Ludmil B. Alexandrov团队所做的研究工作。

研究人员首先根据总拷贝数(TCN)、杂合性,以及CNA片段长度,将样本的拷贝数谱进行编码,构建一个48维的矩阵,随后分解矩阵。

他们使用的肿瘤样本拷贝数矩阵分解算法,来源于实验室之前提出的应用于体细胞突变的方法,既可以识别所有样本共有的拷贝数模式,也可以计算每个样本中由每种CNA特征引起的拷贝数变化(他们称之为样本的特征属性)。

研究人员最终得到了21个不同的泛癌CNA特征,命名为CN1~21。这些特征可以重建97%的样本的基因拷贝数谱,只有3%的样本无法被重建。

随后基于这些特征代表的拷贝数模式特点,他们将21种CNA特征分为了6组:

CN1和CN2分布最为广泛,几乎存在于所有的样本中,分别代表具有2个和3~4个TCN的>40Mb杂合性长片段;

CN3则以具有5~8个TCN的>1Mb杂合性片段为主要特点;

CN4~8包括100kb~10Mb且具有不同TCN或者杂合性丢失(LOH)状态的片段;

CN9~12是长度<40Mb且具有多个LOH组成的片段;

CN13~16中的片段长度>40Mb且具有全染色体或者染色体臂规模的LOH;

CN17包括TCN在2~4之间的LOH片段,以及TCN在3~8之间的杂合性片段,片段长度在1~40Mb;

CN18~21表现出较为复杂的拷贝数模式,并不常见。

看到这里,相信大家可以发现大部分的拷贝数特征的形成原因都与基因组加倍(WGD)有关,说明WGD在特征形成过程中有重要作用,甚至可能会使得特征发生转换。

从理论上来讲,CNA与点突变以及Indel不同的地方在于:点突变和Indel在癌细胞的增殖过程中不断积累,然后通过正向选择固定下来,从而获得一些关键的驱动突变,并形成不变的突变特征;然而,CNA在癌细胞的演化过程中,则容易受WGD这种大规模基因组突变事件的影响。

为了证明这一点,研究人员模拟了一系列数据,最终结果表明WGD发生后,一种CNA特征可以完全变成另一种特征,例如CN1在发生WGD后会变成CN2,也有可能变成CN9。

尽管如此,研究人员认为一些小规模突变事件并不会改变CNA的累加性,因此其中一部分CNA特征仍然是可以用类似点突变和Indel的研究方法进行研究。

接着,研究人员围绕21个CNA特征的起源展开了后续分析。

CN4~8具有较高的TCN,因此认为它们应该和基因组扩增有关,研究人员将这5个特征与已知的扩增子类型进行关联分析,发现所有特征都至少和一种扩增子是正相关(q<0.05)。以往的研究表明基因组扩增是由染色体碎裂引起,因此研究人员将CN4~8与已知的染色体碎裂区域进行匹配,发现CN5~8在这些区域高度富集。

在癌基因组中杂合性丢失(LOH)是常见现象,主要是由染色体重排和等位基因缺失造成的,并且LOH会导致抑癌基因的失活。研究人员发现存在9个CNA特征(CN4、CN5、CN9~15)和基因组上的LOH区域成正相关,并且在多个样本中都出现在已知的抑癌基因附近。

与Geoff Macintyre和Florian Markowetz团队一致的是,Nischalan Pillay和Ludmil B. Alexandrov团队同样发现了与同源重组缺陷有关的CNA特征,CN17富集于携带同源重组关键基因BRCA1/2突变(包括遗传变异和体细胞突变)的样本。

除此之外,他们还发现一些与癌症驱动基因的体细胞变异有关联的CNA特征,例如TP53的突变与多个CNA特征成正相关,而RNF43、HLA-B、HLA-C以及BRAF的突变则与CN2成负相关。

在临床治疗应用方面,Geoff Macintyre和Florian Markowetz团队发现了一些CNA特征可以预测药物疗效。

例如,CX5可以预测奥拉帕利(抑制PARP1)的疗效,甚至一些特征可以成为靶点;CX1与ACTL6A和TERF1的功能紊乱有关,而这两个基因是有丝分裂中染色体正确分离所必需的。

Nischalan Pillay和Ludmil B. Alexandrov则发现,具有基因组扩增CNA特征的患者预后更差。

关于CIA,在同期的《自然》杂志上,格罗宁根大学团队发现,IL-6通路阻断剂——托珠单抗对表现出染色体不稳定的三阴性乳腺癌可能有治疗效果[11]。

总的来讲,这两项研究各自提出了一个能在泛癌水平上系统性地研究染色体不稳定性,以及CNA特征的分析框架,为加深对CIN的理解提供了可利用的工具。

实际上癌基因组拷贝数特征还是一个新兴领域,这两个框架的提出算是这个领域重大的变化了。

参考文献:

[1]Sansregret L, Swanton C. The Role of Aneuploidy in Cancer Evolution. Cold Spring Harb Perspect Med. 2017;7(1):a028373. Published 2017 Jan 3. doi:10.1101/cshperspect.a028373

[2]Levine MS, Holland AJ. The impact of mitotic errors on cell proliferation and tumorigenesis. Genes Dev. 2018;32(9-10):620-638. doi:10.1101/gad.314351.118

[3]Bakhoum SF, Cantley LC. The Multifaceted Role of Chromosomal Instability in Cancer and Its Microenvironment. Cell. 2018;174(6):1347-1360. doi:10.1016/j.cell.2018.08.027

[4]Davies H, Glodzik D, Morganella S, et al. HRDetect is a predictor of BRCA1 and BRCA2 deficiency based on mutational signatures. Nat Med. 2017;23(4):517-525. doi:10.1038/nm.4292

[5]Cohen-Sharir Y, McFarland JM, Abdusamad M, et al. Aneuploidy renders cancer cells vulnerable to mitotic checkpoint inhibition. Nature. 2021;590(7846):486-491. doi:10.1038/s41586-020-03114-6

[6]Macintyre G, Goranova TE, De Silva D, et al. Copy number signatures and mutational processes in ovarian carcinoma. Nat Genet. 2018;50(9):1262-1270. doi:10.1038/s41588-018-0179-8

[7]Thutkawkorapin J, Eisfeldt J, Tham E, Nilsson D. pyCancerSig: subclassifying human cancer with comprehensive single nucleotide, structural and microsatellite mutational signature deconstruction from whole genome sequencing. BMC Bioinformatics. 2020;21(1):128. Published 2020 Apr 3. doi:10.1186/s12859-020-3451-8

[8]Maclachlan KH, Rustad EH, Derkach A, et al. Copy number signatures predict chromothripsis and clinical outcomes in newly diagnosed multiple myeloma. Nat Commun. 2021;12(1):5172. Published 2021 Aug 27. doi:10.1038/s41467-021-25469-8

[9]Drews RM, Hernando B, Tarabichi M, et al. A pan-cancer compendium of chromosomal instability. Nature. 2022;606(7916):976-983. doi:10.1038/s41586-022-04789-9

[10]Steele CD, Abbasi A, Islam SMA, et al. Signatures of copy number alterations in human cancer. Nature. 2022;606(7916):984-991. doi:10.1038/s41586-022-04738-6

[11]Hong C, Schubert M, Tijhuis AE, et al. cGAS-STING drives the IL-6-dependent survival of chromosomally instable cancers. Nature. 2022;10.1038/s41586-022-04847-2. doi:10.1038/s41586-022-04847-2

推荐内容