DNA甲基化是最早发现的基因表观修饰方式之一,可能存在于所有高等生物中。DNA甲基化能关闭某些基因的活性,去甲基化则诱导了基因的重新活化和表达。甲基化的主要形式有5-甲基胞嘧啶,6-甲基腺嘌呤和7-甲基鸟嘌呤。原核生物中CCA/TGG和GATC常被甲基化,而真核生物中甲基化仅发生于胞嘧啶。
DNA的甲基化是在DNA甲基化转移酶(DNMTs)的作用下使CpG二核苷酸5端的胞嘧啶转变为5甲基胞嘧啶。这种DNA修饰方式并没有改变基因序列,但是它调控了基因的表达。
脊椎动物基因的甲基化状态有三种:持续的低甲基化状态,如管家基因;去甲基化状态,如发育阶段中的一些基因;高度甲基化状态,如女性的一条失活的X染色体。
哺乳动物中,CpG序列在基因组中出现的频率仅有1%,远低于基因组中的其它双核苷酸序列。但在基因组的某些区域中,CpG序列密度很高,可以达均值的5倍以上,成为鸟嘌呤和胞嘧啶的富集区,形成所谓的CpG岛。通常,CpG岛大约含有500多个碱基。在哺乳动物基因组中约有4万个CpG岛,而且只有CpG岛的胞嘧啶能够被甲基化,CpG岛通常位于基因的启动子区或是第一个外显子区。
健康人基因组中,CpG岛中的CpG位点通常是处于非甲基化状态,而在CpG岛外的CpG位点则通常是甲基化的。这种甲基化的形式在细胞分裂的过程中能够稳定的保留。当肿瘤发生时,抑癌基因CpG岛以外的CpG序列非甲基化程度增加,而CpG岛中的CpG则呈高度甲基化状态,以致于染色体螺旋程度增加及抑癌基因表达的丢失。