CGC,简单理解癌症基因调查。最早由sanger研究所发表于《Nature Reviews Cancers》,doi:10.1038/nrc1299
文章Summary:
We have conducted a census from the literature of genes that are mutated and causally implicated in cancer development (‘cancer genes’). • So far, 291 cancer genes have been reported, more than 1% of all the genes in the human genome. • 90% of cancer genes show somatic mutations in cancer, 20% show germline mutations and 10% show both. • The most common mutation class among the known cancer genes is a chromosomal translocation that creates a chimeric gene or apposes a gene to the regulatory elements of another gene. • Many more cancer genes have been found in leukaemias, lymphomas and sarcomas than in other types of cancer, despite the fact that they represent only 10% of human cancer. These genes are usually altered by chromosomal translocation. • The most common domain that is encoded by cancer genes is the protein kinase. Several domains that are involved in DNA binding and transcriptional regulation are common in proteins that are encoded by cancer genes
第四条很有意思,已知癌症基因最常见的突变类型是由于染色体易位产生嵌合基因或者将一个基因的调控元件贴到其他基因上。也就是说,结构变异是癌症基因中常见的突变。
CGC列表不包括启动子区域内CpG二核苷酸的甲基化变化是唯一报告的异常的基因。但是很多替换与转录调控相关,在一些病例中(CDKN2A 或者 MLH1)中,可能会造成转化成肿瘤。
由于以下原因,一些可能的癌症基因没有放到列表中:
- 基因中的突变太少。肿瘤的克隆学说提出了乘客基因的概念,但是这些乘客基因的功能多是未知的。一些乘客基因可能以cluster的方式在肿瘤发展中发挥作用。因此,文章中排除了在原发性肿瘤中报道少于5个明确的体细胞突变的基因。
- 基因中的突变太多。癌症错配修复基因(MMR)的缺陷会导致在短的串联重复序列(又叫做微卫星)中成千上万的小的indels。当然,大多数出现在内含子或者基因间区域,大多数是确认的乘客突变。然而有些事出现在编码区,因此会导致移码,导致蛋白质过早终止或无义介导的RNA衰变,很可能这些中的一小部分与肿瘤发生有因果关系。可是大多数情况并非如此。在这些情况下,将突变的癌症基因与具有乘客突变簇的基因区分开来是很难的。突变数目过多,或者MMR缺陷的细胞的基因也被排除在外。
- 推定的癌症基因在癌细胞中具有特别高的突变率。在基因组的一小段区域内出现大量的突变。比如,FHIT和WWOX基因每个跨越一个脆弱的位点(fragile sites,分别为FRA3B和FRA16D)。 脆性位点是与染色体断裂的高频率相关的基因组区域,并且许多最初通过正常淋巴细胞的化学应激来识别。这些区域的内在脆弱性经常在癌细胞中表现为重排和缺失,突变模式类似于在某些隐性癌基因中发现的突变模式(例如,CDKN2A和PTEN 15,16)。因此,仅仅基于突变聚类和模式,尚不清楚FHIT和WWOX是否是隐性癌基因或由于DNA修复过程中的缺陷而经常在癌细胞中重排的脆弱位点, 或两者都存在。因此,尽管FHIT和WWOX有其他的生物学功能支持它们是癌基因,但是由于与脆弱性位点重合,也没有被报道。
- 包含许多基因的突变。大多数的突变,比如碱基替换,仅仅影响单个基因。但是拷贝数改变,比如基因的扩增,能够影响数兆的DNA,包含多个基因。而单单依靠遗传证据,很难清楚地区分究竟是哪个基因发挥了关键的功能。将来可能会收录更多的发生扩增的基因。
- 低外显率癌症易感基因。高外显率的基因容易判断是否是癌基因,而低外显率就很难说了。比如APC I130K和CHK2 1100delC变异的效果很强,但对于更多的基因,效应在统计学上是弱的且不冲突的。因此,没有将癌症易感基因包括进来。