锐湃尔®(REPERE®)技术的理论基础——完全人源的基因编辑器起源:时间轴上动态变化的人类基因组

06-banner02

锐湃尔®REPERE®)技术的理论基础——完全人源的基因编辑器起源:时间轴上动态变化的人类基因组

锐湃尔® (REPERE®技术的理论基础——完全人源的基因编辑器起源:时间轴上动态变化的人类基因组锐湃尔® (REPERE®技术的理论基础1—由古及今的内含子及逆转座子的演变与异同。

首先从古代较为原始的现象和机制入手探寻人体内可能存在的基因编辑技术。II型内含子(Group II Intron)是细菌中普遍存在的逆转座子。II型内含子的转座功能依赖于其内含子RNA剪切形成的套索结构+细菌自身产生的核酸内切酶和逆转录酶(目前Targetron基因编辑技术的基础)1-4。由转录产生的内含子RNA经自剪切产生RNA成分的套索结构(II型内含子RNA),结合其表达的逆转录酶后,切开基因组特定位点,以双链基因组的其中一条单链作为引物(TRPT途径),将RNA逆转录为单链DNA及双链DNA,最终与基因组结合形成 “Ω” 型结构,经同源重组或其他机制5将II型内含子整合入基因组特定位点完成转座。

由古推今,不难看出内含子产生的早期目的即是为了对基因组进行定向重构,同时该作用的达成需要借助于逆转座子及相应逆转录酶和内切酶的辅助。巧合的是,在众多特异且定向的基因组重构现象(详见下文)出现的同时,人体内既存在内含子RNA经剪切产生的套索结构,也存在至今仍具有活性的可表达逆转录酶和核酸内切酶的逆转座子。况且内含子和逆转座子序列占据了人类基因组大部分的区域6,7,理应具有其特定的意义和作用。因此,现今人类基因组上的逆转座子和内含子能否如细菌中的II型内含子(Group II Intron)一样定向且特异的对基因组进行重构?

II型内含子的转座机制简图(Cousineau, B. ,  Smith, D. ,  Lawrence-Cavanagh, S. ,  Mueller, J. E. ,  Y  Jian, &  Mills, D. , et al. (1998). Retrohoming of a bacterial group ii intron: mobility via complete reverse splicing, independent of homologous dna recombination. , 94(4), 0-462.)

锐湃尔®(REPERE®技术的理论基础2——在人体中存在的短RNA套索结构及多种内含子剪切方式

人体内内含子RNA经剪切所形成的套索结构半衰期极短,难以实际检测8,9。同时目前绝大多数已知的内含子RNA经剪切形成的套索结构均为电脑预测或推测,真正于体内验证过的套索结构不超过100个10。这使得我们至今对于RNA经剪接作用所产生的内含子套索,尤其是高等生命如人类体内的内含子套索,仍知之甚少,而内含子套索的剪切形式,主要以侧面推测为主。

有研究显示内含子产生的circRNA可由内含子RNA经剪接体剪切形成的套索结构生成11,与此同时,将具有多聚A尾的线性RNA去除后,测序所得的以剪切位点为起始或终止的内含子circRNA(说明该内含子circRNA与内含子RNA剪切有关),其长度绝大多数<400bp12。以上现象提示内含子RNA套索其长度较短,同时剪接机制对于前体RNA(pre-mRNA)中内含子的处理为短片段逐渐除去,而非此前惯常认为的大片段完整去除。

在内含子中潜藏的大量剪接作用位点以及广泛存在的递进式剪切佐证了这一推论9,且基因组上广泛分布的互相之间间隔较短的剪切序列“AGGT”或“AGGC”,以及套索结构形成时所需的分支点于基因组上大量分布且其被剪接复合体识别的几率各不相同13也为多种套索剪切方式的并存提供了理论基础。另外,已有研究证明有的内含子其主要的剪切方式即为递进式剪切,且即使缩短内含子长度,剪切仍将以递进的方式进行8。此外,虽然RNA的选择性剪切存在于人类基因组中超90%的基因中,然而大多数的选择性剪切产物均无明确的作用14,15,也提示选择性剪切或并非单纯为了产生各异的蛋白质,而是另有目的,如多种套索剪切方式的副产物。结合人类基因上广泛存在外显子一端具有剪切序列“GT”或“AG”,但其另一端却并不存在相应剪切序列的现象,提示除外常规仅剪切内含子的pre-mRNA剪切方式,应有另一种发生概率明显较之为低的剪切方式,该剪切方式将同时剪切外显子及一部分内含子,与常规的剪切方式(即剪切对象完全为内含子,不包含外显子)互相交错并部分重叠。常规方式的剪切(不剪切外显子)更强,在其压制下使得另一种剪切方式(剪切外显子)发生的概率要较其低得多;当另一种剪切外显子的剪切方式发生时,随之产生各类选择性剪切RNA。

此外,在去除参与内含子剪切的剪接因子ASF/SF2后,真核细胞基因组出现明显的不稳定并在细胞核中出现染色体外的高分子长DNA片段16。这一现象同样印证了pre-mRNA序列的识别剪切及其产物套索RNA在基因组重构中所发挥的重要作用。

Pre-RNA所剪切的内含子为短片段。前体RNA具有两套内含子剪切方式,其中一种不剪切外显子,占绝大多数,其强烈压制另一种剪切外显子的方式(Sui, Y., & Peng, S. (2021). A Mechanism Leading to Changes in Copy Number Variations Affected by Transcriptional Level Might Be Involved in Evolution, Embryonic Development, Senescence, and Oncogenesis Mediated by Retrotransposons. Frontiers in cell and developmental biology9, 618113. https://doi.org/10.3389/fcell.2021.618113)

锐湃尔®(REPERE®技术的理论基础3——人类逆转座子协助内含子进行基因组重构

此前提到的细菌中的II型内含子予以我们一定的启示,提示内含子RNA可由逆转座子逆转录为单链及双链DNA并整合入基因组,而人体内恰好存在至今仍具有活性的逆转座子Alu元件和LINE-1 17,18。LINE-1编码ORF2p——人体内源性的内切酶和逆转录酶,该蛋白可助其本身的RNA乃至任意mRNA逆转录并插入(转座)回基因组17,18;Alu元件所转录的RNA亦可与ORF2p相结合并在其辅助下逆转录并插入(转座)至基因组中17,18

由前述可知,人体内所产生的内含子套索RNA其长度绝大多数<400bp12,同时,人体内同样存在着相似长度的,长度<400bp的单链或双链短DNA片段,其产生与相应基因的转录及mRNA剪接关系密切19,20。这说明人体内应存有某种机制,可将短RNA转化为短DNA。有报道称,在LINE-1的帮助下,任何mRNA均可被逆转录并被插入(转座)至基因组中21,22。这些现象证明了人体内的LINE-1及Alu元件这些转座子具有足够的能力进行基因编辑,然而这些整合现象仍处于随机整合状态,无法完成精准的基因组插入。但占据了人类基因组大部分区域的转座子,果真只能随机整合,而无特定作用?是否可以将其改造为可以进行精准基因编辑的基因编辑工具呢?

显而易见,内含子RNA经剪接机制产生的套索结构具有3’端残端(同时其5’端处于闭合状态,无法连接其他序列)12,同时Alu元件转录产生的RNA在细胞核内可于其序列中间的固定位点(118nt)被剪切为5’部分和3’部分,其3’部分留有5’端残端23,24。有趣的是,5’部分可以较长时间存在于细胞中,但却难以寻觅3’部分的踪迹。一般认为3’部分或许是因为其半衰期极短被降解了,但两部分的序列差距并不大,性质差异如此巨大似有不合理;此外,亦有另一种可能,即3’部分与细胞核内的其他成分相结合后产生了新的RNA,从而难于检测。由上可知,Alu元件RNA经剪切产生的5’端残端恰可与内含子RNA套索的3’端残端相连接,形成套索-Alu(RNA),产生类似于II型内含子的内含子RNA套索+逆转座子的组合,为其逆转录及定向转座提供基础。Alu元件RNA于核内剪切产生的3’部分可结合人源的、由LINE-1表达产生的核酸内切酶及逆转录酶ORF2p,ORF2p可切开基因组单链并解旋基因组,以该基因组单链为引物引发逆转录(TPRT途径),依次合成含有靶位点上下游序列及待插入序列(即套索结构上的序列,详见下文)的DNA单链、双链,最后介导基因组插入(转座)25,26

关于ORF2p的作用机制和剪切对象,已有不少现象给予了提示。Alu元件3’部分-RNA结合ORF2p后其于基因组上所作用的剪切序列(识别目标)绝大多数为5′-TTTT/AA-3’(“/”代表剪切位点),而该剪切序列(识别目标)于Alu元件3’部分-RNA上所对应(互补)序列(“AAAA”和“TT”)则分列于Alu元件3’部分-RNA二级结构所形成的“Ω”型的双腿上,“AAAA”和“TT”之间为“Ω”结构的中间缺口,“Ω”结构的缺口正对基因组上的剪切位点25-27。结合体外实验中ORF2p除外5′-TTTT/AA-3’亦可剪切其他多种序列的结果28,基因组上特定的5′-TTTT/AA-3’剪切提示ORF2p剪切具有序列特异性,ORF2p在特定RNA二级结构的辅助下识别基因组上与ORF2p所结合RNA序列互补的序列,并于特定位置(“Ω”结构的中间缺口)处内切基因组:ORF2p识别基因组上与分列于ORF2p所结合RNA的“Ω”二级结构左右两脚上的六位碱基序列相互补的序列,并于“Ω”缺口无遮挡处(“Ω”切口所对处)切开基因组单链并解旋。此后以切开的基因组单链为引物,ORF2p将内含子套索+Alu元件3’部分的RNA逆转录为单链DNA。此外,除外5′-TTTT/AA-3’,人类基因组上ORF2p所作用的其他序列(5′-CTTT/AA-3’、5′-TCTT/AA-3’、5′-TTCT/AA-3’及5′-TTTC/AA-3’)28,也与各活性Alu元件3’部分RNA的“Ω”型二级结构一侧腿(右腿)上的多聚A序列上序列(“AAAG”、“AAGA”、“AGAA”及“GAAA”)相匹配(互补),进一步印证了ORF2p基因组剪切的序列特异性,由ORF2p介导的基因组内切作用具有精准定向的潜质。

Alu元件转录产物RNA在CNV延伸机制中的剪接位点(绿色)、内切识别序列(红色)(黑色线条标示分列于“Ω”结构两脚上的识别序列)及内切作用二级结构“Ω”(蓝色)
图片摘自Häsler J, Strub K. Alu elements asregulators of gene expression [published correction appears in Nucleic AcidsRes. 2007;35(4):1389]. Nucleic Acids Res. 2006;34(19):5491-5497.doi:10.1093/nar/gkl706

ORF2p于基因组上所造成的实际插入序列,红框标出“Ω”结构一侧的识别序列         图片摘自Cost, G. J., and Boeke, J. D. (1998). Targeting ofhuman retrotransposon integration is directed by the specificity of the L1endonuclease for regions of unusual DNA structure. Biochemistry 37,18081–18093. doi: 10.1021/bi981858s


人类基因组上各类Alu元件序列,部分ORF2p结合序列用红框标出,可见其与上述ORF2p于基因组上所造成实际插入序列相匹配。序列摘自NCBI

而对于DNA单链转化为DNA双链,此前尚未有明确理论给出ORF2p合成Alu元件-ssDNA第二条链并将该双链DNA插入至基因组的相关机制的合理解释;其中有理论研究了ORF2p在切开基因组第一条链(识别序列为5′-TTTT/AA-3’)后若在原位切开第二条链,ORF2p需要识别的第二条链上的剪切序列。结果显示第二条链上由ORF2p识别并剪切的序列并无甚规律25,26。当ORF2p逆转录产生单链DNA后,ORF2p将移动至单链DNA的3’端。鉴于DNA聚合酶的特性:仅可沿匹配的DNA双链滑动同时寻找作用位点,当且仅当靶位点上游序列完全匹配时,ORF2p方可滑动至其所结合ssDNA二级结构“Ω”缺口处,识别基因组上与“Ω”缺口两侧序列所互补的序列后于“Ω”切口所对处(靶位点)切开基因组单链作为引物,并依上述机制将DNA单链转化为DNA双链。基于此,每次细胞分裂前,细胞核中仅具有靶位点的单链DNA可转化为双链DNA。

此后,所产生的双链DNA将再次结合于靶位点处,ORF2p将继续按照上述机制切开靶位点处基因组单链,但同时由于其所结合单链DNA已转化为双链DNA,ORF2p亦将切开其所结合双链DNA中与基因组上切开单链序列相一致的一条单链,促进同源重组的发生。在细胞分裂期,同源重组相关蛋白高表达并将ORF2p产生的两个断端相连,经由同源重组机制将目的片段插入至靶位点,此即锐湃尔®(REPERE®)技术的基础机制。

由于真核生物如人类其同源重组仅发生于每次细胞分裂的S期和G2期,同时据锐湃尔®REPERE®)技术基础机制,在每次分裂间期,每个基因只有其中一小段特定序列(具有靶位点的序列)可形成具有进一步同源重组能力的双链DNA,这使得该机制确保了每一次细胞分裂仅可插入一段特定序列。由上述多种并存的pre-mRNA剪切机制可知,高剪切率(产生率)的套索序列与低剪切率(产生率)的套索序列互相交叠,当一个高产生率套索中的序列被插入至基因组上其相应基因拷贝中后,下一个需要被插入的序列则在低产生率的套索中。上一个被插入的序列则作为下一个被插入序列的上游引导序列。低产生率的套索仅基因高表达时才可稳定产生足够的其相应双链DNA的量以准确稳定的插入基因组中延长相应基因拷贝。如此,通过限制细胞分裂及控制相应基因表达,可精确控制每个细胞的基因组变化,满足胚胎发育等病生理过程所需求的复杂基因变化和差异的同时,符合其中所观测的相应基因组变化现象。此外,该过程与细菌中的II型内含子转座有多处共同之处,如均是先使pre-mRNA通过特殊的二级结构形成套索结构,此后通过结合于内含子RNA套索的内切酶切开基因组,同时通过TRPT途径将RNA逆转录为双链DNA,最终双链DNA与基因组结合形成“Ω”型结构并通过同源重组插入至基因组5

锐湃尔®(REPERE®)技术基础机制的原理简图(Sui, Y., & Peng, S. (2021). A Mechanism Leading to Changes in Copy Number Variations Affected by Transcriptional Level Might Be Involved in Evolution, Embryonic Development, Senescence, and Oncogenesis Mediated by Retrotransposons. Frontiers in cell and developmental biology9, 618113. https://doi.org/10.3389/fcell.2021.618113

 


锐湃尔®(REPERE®)技术基础机制与II型内含子归巢机制的对比(Sui, Y., & Peng, S. (2021). A Mechanism Leading to Changes in Copy Number Variations Affected by Transcriptional Level Might Be Involved in Evolution, Embryonic Development, Senescence, and Oncogenesis Mediated by Retrotransposons. Frontiers in cell and developmental biology9, 618113. https://doi.org/10.3389/fcell.2021.618113

锐湃尔®(REPERE®技术的理论基础4——胚胎发育过程中基因组的建造与拆解

拷贝数变异(copy number variation,CNV),通常具有相应基因启动子和转录序列等组分并可影响相应基因表达,其作为广泛存在于各基因中且占据人类基因组大块区域的遗传变异29-32,在首次人类基因组测序中即被严重低估7,直至近年才被逐步发掘并得到重视。目前已发现至少数千个基因具有拷贝数变异29-32。在肿瘤细胞、发育的胚胎以及人诱导多能干细胞所分化的各类组织中,均可见有规律的、特异的基因组上拷贝数变异改变,虽然目前这些改变尚无明确且合理的机制进行解释,但这些改变均与细胞分裂及相应基因的转录水平密切相关33-43。已有多项研究显示,基因拷贝数可显著影响相应基因的表达以及组织细胞的表型42,44。另有研究显示,胚胎干细胞基因组上各基因的拷贝数可随着有丝分裂发生变化45。此外,在上述发生基因拷贝变化的细胞——肿瘤细胞、干细胞以及胚胎细胞中,亦可见转座子如LINE-1及SINE(如Alu元件)的去甲基化以及高表达46-49,且对LINE-1的表达进行抑制后胚胎发育将发生停滞50。以上实验结果展示了人类基因组中逆转座子的转座功能与胚胎中各基因拷贝数变化及胚胎发育之间有着紧密的联系。同时也提示了基因组上的基因拷贝为动态变化的,而非一成不变的。下文中将动态变化的基因拷贝称为基因拷贝(副本),而固定的、副本扩增所依照的序列则称为完整基因(原本)。

CNV包含启动子及相应基因转录序列等组分以行使其影响基因表达的功能。基因拷贝(副本)的转录区域的扩增及延伸可以由上述内含子RNA套索-Alu机制—锐湃尔®(REPERE®)技术的基础机制所介导。完整基因(原本)转录区域转录产生的pre-mRNA经剪接机制可产生各式互相之间部分交叠的内含子套索RNA并由连接Alu元件3’部分-RNA并结合ORF2p将该内含子套索RNA逆转录为单链DNA,随后仅有在基因组上具有靶位点(即基因拷贝(副本)延伸的末端,延伸位点)的单链DNA可以继续形成双链DNA并最终通过同源重组机制被插入至基因组,进而对基因拷贝进行延伸,该过程将在下文中详细阐述。

随着每次细胞分裂及基因拷贝(副本)转录区域的延伸,新的且唯一的靶位点(即基因拷贝(副本)延伸的末端,延伸位点)将依次产生,使得每次分裂中仅相应具有基因拷贝(副本)延伸位点上游序列及不存在于基因拷贝(副本)延伸末端的、仅位于完整基因(原本)中拷贝延伸位点上游序列相对应序列的下游序列的内含子RNA套索(即具有靶位点的内含子RNA套索)逆转录所形成的单链DNA可通过序列互补结合于基因组上靶位点处,形成“Ω”型二级结构,并藉由ORF2p的功能将单链DNA转化为双链DNA,最终经效率提高的同源重组机制将不存在于基因拷贝(副本)延伸末端的、仅存于完整基因(原本)中拷贝延伸位点上游序列相对应序列的下游短序列插入至靶位点,达到延伸基因拷贝(副本)的目的。随着新的片段被插入至基因拷贝(副本)的延伸末端,新的靶位点将产生,而新的靶位点又将引入此前插入片段的下游片段,如此循环往复,逐渐延伸基因拷贝(副本)。上述机制使得每次细胞分裂严格遵循仅插入一段特定的短片段,逐渐按照完整基因(原本)转录出的RNA将基因拷贝(副本)向下游延伸。随着基因拷贝(副本)的延伸,相应基因的表达亦将逐渐增加,进而影响相应细胞的表型,使各细胞逐渐转化为相应具有特定基因CNV的细胞,即分化。由于仅高表达的基因可以稳定延伸其相应基因拷贝,个体可以通过控制各细胞中的各基因表达(如环境影响等因素)和细胞分裂,达到精细操控各细胞分化情况和表型的目的,同时产生千变万化的各类细胞及细胞表型。此外,由于每一个基因的序列长度并不一致,两种不同基因的基因拷贝(副本)即使同时随分裂延伸,其表达的变化亦是不同的,两种基因不同的变化又会继续影响其他基因的表达和其相应基因拷贝(副本)的延伸,正是因为如此,胚胎在分化过程中,即使单纯的不断分裂亦可产生精密调控又各式各样的细胞,而看似无明显作用的内含子其存在或正是为了在不改变蛋白编码序列的前提下,通过添加或延长内含子序列从而增加整个基因序列的长度,调整其相应基因在胚胎中的变化率,十分重要。

锐湃尔®(REPERE®)技术基础机制的原理简图,由图可见CNV的逐渐延伸机制,即CNV延伸理论(Sui, Y., & Peng, S. (2021). A Mechanism Leading to Changes in Copy Number Variations Affected by Transcriptional Level Might Be Involved in Evolution, Embryonic Development, Senescence, and Oncogenesis Mediated by Retrotransposons. Frontiers in cell and developmental biology9, 618113. https://doi.org/10.3389/fcell.2021.618113

而各基因转录区域上游的诸如启动子等非转录区域则可能由主要分布于基因间和非编码区域的LINE-151来介导其转座和基因拷贝工作。LINE-1在胚胎发育的早期高度表达46,同时LINE-1可以较为高效的辅助其下游序列(可达3000bp)进行转座,这一过程称为3’转导52。此外,LINE-1的转座活动可以使生殖细胞或早期胚胎分化为不同的细胞系53,54;而在胚胎发育过程中,LINE-1的转座活动可以增加基因的表达以及影响细胞分化55。由于LINE-1的转录由RNA聚合酶II负责,其可以转录较长片段并具有转录其下游序列如各基因非转录区域的能力,并可在ORF2p的协助下对各基因的非转录区域进行转座,最终将所转录的各基因非转录区域定向插入至基因组的特定位点,起始各基因的基因拷贝(副本)的延伸和扩增。当基因拷贝(副本)非转录区域的扩增和延伸完成后,Alu元件将接着介导转录区域的扩增和延伸。以上即为CNV延伸理论。另外,精子中可见独立于基因组的DNA片段被称做精子DNA片段(sperm DNA fragmentation ,SDF),该片段普遍存在于正常的精子中56,生殖细胞中游离于染色体之外的DNA片段的存在亦为CNV延伸理论提供了支持。

在人类基因组上,Alu元件主要分布于富含基因的区域57,58而LINE-1主要分布于不含基因的基因间区域51,Alu元件和LINE-1的分布区域存在较大的差异,呈相反关系59。这些现象在一定程度上也同样佐证了上述理论。

胚胎发育时期基于逆转座子及内含子的CNV延伸(Sui, Y., & Peng, S. (2021). A Mechanism Leading to Changes in Copy Number Variations Affected by Transcriptional Level Might Be Involved in Evolution, Embryonic Development, Senescence, and Oncogenesis Mediated by Retrotransposons. Frontiers in cell and developmental biology9, 618113. https://doi.org/10.3389/fcell.2021.618113

 有增添,相应的就有删减。对于已经分化的细胞,若需要重新变为胚胎进行发育(如精子和卵子结合转化为受精卵或应用体细胞进行克隆),则势必需要重新初始化,将已经添加的、用以促进分化的各基因拷贝(副本)去除。Alu元件的于基因组上广泛分布且相同类型Alu元件聚集于同一区域60,61等特性使得Alu元件互相之间可发生同源重组并删去发生同源重组的两个Alu元件之间的区域,最终删去整个基因拷贝(副本)。虽然Alu元件广泛且较为均匀的分布于各基因中,但由于基因组中大部分的CpG岛存在于Alu元件中并导致Alu元件高甲基化,使得基因组上的Alu元件终个体一生均保持高甲基状态62,63,高甲基化的Alu元件之间因无法发生同源重组64,防止了两个Alu元件之间发生同源重组而导致的二者之间片段的丢失,使得胚胎发育分化产生的基因拷贝(副本)可以稳定保存,细胞表型得以稳定存在,持续个体一生。

有研究显示,在胚胎早期着床之前,基因组上所有的Alu元件不分种类其甲基化均降为近乎完全去甲基化的状态65,这为胚胎发育初期基因拷贝(副本)的删除提供了基础。在胚胎发育早期,随着受精卵的分裂,细胞全基因组的甲基化将逐渐降低,去甲基化在着床前达到高峰,随后基因组的甲基化将迅速升高至一个较高的水平65,66。这一现象与胚胎早期基因拷贝(副本)中的Alu元件首先逐渐去甲基化,当其甲基化降低到一定程度后,Alu元件之间发生同源重组并逐渐将所添加的基因拷贝(副本)删除,低甲基化的基因拷贝(副本)被删除后细胞基因组的甲基化迅速提升这一过程相吻合。同时,对胚胎早期着床前的胚胎细胞进行研究的结果表明,在低甲基化的胚胎细胞中可观察到CNV的增加,而在高甲基化的胚胎细胞中则可观察到CNV的减少36。这一结果也同样说明了由去甲基化引发基因拷贝(副本)删去这一现象,在基因组逐渐去甲基化的过程中,基因拷贝(副本)尚未被删去,而当胚胎细胞转为高甲基化时,各基因的低甲基化CNV(基因拷贝(副本))已被删去,由此导致了高甲基化。此外,以人类胚胎为研究对象的实验显示在高比例的分裂期胚胎细胞中可观察到染色体的不稳定,包括频繁的片段删除、复制、扩增以及CNV改变,值得注意的是,即使出现上述的这些染色体不稳定,相应胚胎仍可继续发育为正常个体35,提示此类染色体不稳定并非单纯的病理现象。

胚胎发育时期基于逆转座子之间同源重组的CNV拷贝删除(Sui, Y., & Peng, S. (2021). A Mechanism Leading to Changes in Copy Number Variations Affected by Transcriptional Level Might Be Involved in Evolution, Embryonic Development, Senescence, and Oncogenesis Mediated by Retrotransposons. Frontiers in cell and developmental biology9, 618113. https://doi.org/10.3389/fcell.2021.618113

 在早期胚胎着床后,胚胎细胞的全基因组甲基化水平从谷底反弹回较高水平,并将维持于较高水平直至出生乃至生命的终生65,67,68,防止了Alu元件之间的同源重组及片段删除,为此后的胚胎时期的基因拷贝(副本)的重新延伸和扩增以及出生后胚胎分化成果的维持提供了基础。胚胎时期不同细胞的不同转录状况使得相应细胞内出现不同的基因CNV延伸和扩增,最终分化为不同细胞。在胚胎发育过程中,不同组织及同一组织在不同时期,其蛋白表达各不相同67,亦佐证了这一机制。此外,上文提到的染色体外的DNA片段,在胚胎发育过程中的各个阶段不断变化69,70,也提示了基因组在胚胎发育过程的不同阶段接受了不同的重构。基于CNV延伸理论,在胚胎发育过程中,每次细胞分裂均会带来细微的特定基因拷贝(副本)改变,不同基因的拷贝(副本)改变、同一基因的不同拷贝(副本)改变及其导致的基因表达改变的大量组合为胚胎发育的精密性和复杂性提供了基础。

总而言之,在胚胎发育方面,基因组中所包含的时间信息(如内含子信息等)的重要性并不亚于其编码序列。人类基因组可以由相应基因表达所介导,使基因拷贝(副本)如乐高积木一样堆砌,进而改变细胞表型并产生分化;而胚胎早期则将已添加的基因拷贝(副本)如乐高积木般拆去,使细胞“初始化”,为此后再一次的堆积乐高积木做准备。目前所做的种种细胞分化诱导,可能即是通过体外给予信号干预相应基因表达,从而产生分化或逆分化效果。

每个细胞特征性的CNV改变将影响相应细胞表型,继而影响其他细胞的基因表达和CNV拷贝延伸,最终形成胚胎中复杂且各异的各细胞表型(Sui, Y., & Peng, S. (2021). A Mechanism Leading to Changes in Copy Number Variations Affected by Transcriptional Level Might Be Involved in Evolution, Embryonic Development, Senescence, and Oncogenesis Mediated by Retrotransposons. Frontiers in cell and developmental biology9, 618113. https://doi.org/10.3389/fcell.2021.618113

锐湃尔®REPERE®技术的理论基础5——锐湃尔®(REPERE®基础机制(套索内含子-Alu机制)的一些其他可能的病生理体现

抛开基因的拷贝数变化,IT15FMR1基因上的重复三联核苷酸的扩增71-75以及HIV基因偏好插入于基因组Alu元件中76-78,同样与所涉基因的转录水平和细胞分裂有着紧密的联系,进一步提示基因组重构与基因转录、细胞分裂以及Alu元件之间存在关联。

在肿瘤细胞中,Alu元件、LINE-1及其转座所需的蛋白如ORF2p均明显提高79,80,提示转座子与肿瘤发生之间可能存在联系。在肿瘤细胞中,可以观察到高表达的癌基因的扩增以及低表达的抑癌基因的拷贝数减少41,81-88。同时,一些肿瘤相对固定的发病年龄89,90亦提示在肿瘤发生的过程中存在某种类似累及效应的机制存在。此外,对于不分裂的细胞如成熟分化的各类肌肉细胞和神经元,其相应肿瘤的发生是极其罕见的,甚至是不存在的;此外,手术切除后复发的胶质瘤,其肿瘤细胞在手术后经持续分裂,其级别通常亦会有所升高91,提示了肿瘤发生与细胞分裂的紧密关系,而根据锐湃尔®(REPERE®)基础机制,高表达的基因(如肿瘤细胞中的癌基因),其基因拷贝(副本)随细胞分裂进行扩增并可因此导致肿瘤级别提高,这与复发肿瘤的级别上升现象正是相符的。以上种种肿瘤发生的相关现象同样均与锐湃尔®(REPERE®)的基础机制相符合,提示锐湃尔®(REPERE®)基础机制在肿瘤发生中起着重要作用。

锐湃尔®(REPERE®)的基础机制亦可见于HIV基因组的人类基因组插入现象。HIV基因组偏好于插入至人类基因组中的Alu元件中,尤其是高转录水平基因上的Alu元件,此种克隆性扩增的插入仅发生于人体中少数具有持续增殖能力的细胞76-78,而在人体内,恰恰仅具有持续增殖能力的干细胞中的LINE-1和Alu元件仍旧保持转座活性,提示HIV基因组的这种插入方式与人体内的转座子相关;此外,在上述现象中被插入的HIV基因组仅为其完整基因组的一部分(主要为HIV基因组的5’部分)亦提示该插入与pre-mRNA的剪切相关76-78。该过程可简述为:当HIV通过其自身的整合酶插入至人类基因组中的Alu元件序列中后,该Alu元件所在的基因进行转录产生相应基因pre-mRNA,此后该pre-mRNA被剪接体剪切产生5’端落在Alu元件内并包含有部分HIV基因组序列(主要为其5’部分,在基因上紧邻Alu序列)的内含子RNA套索,该内含子RNA套索下游连接经剪切所得的Alu-RNA的3’部分,此时该部分HIV基因组序列两侧均为Alu序列,最后通过锐湃尔®(REPERE®)基础机制,借由Alu序列之间相同或相似的序列,部分HIV基因组通过其相应的内含子套索-Alu(RNA)不断插入至人体基因组内的其他Alu元件中,于具有增殖能力的免疫细胞的基因组内广泛且持续的进行扩增。

基于锐湃尔®REPERE®技术基础机制的HIV基因组于人类基因组Alu元件内的克隆性扩增(Sui, Y., & Peng, S. (2021). A Mechanism Leading to Changes in Copy Number Variations Affected by Transcriptional Level Might Be Involved in Evolution, Embryonic Development, Senescence, and Oncogenesis Mediated by Retrotransposons. Frontiers in cell and developmental biology9, 618113. https://doi.org/10.3389/fcell.2021.618113

此外,在Huntington舞蹈病及脆性X综合症中,致病基因(IT15FMR1)转录区域中过长的三联核苷酸重复序列将会导致该三联核苷酸重复序列的逐渐扩增,这一扩增现象与相应基因的转录水平高度相关71-75。依据锐湃尔®(REPERE®)基础机制,当三联核苷酸重复序列过长时,内含子RNA套索的5’端序列将可能由三联重复序列外的特异性序列落至三联重复序列内,使得本应具有特异性的内含子RNA套索的5’端序列丧失特异性,从而导致锐湃尔®(REPERE®)基础机制中ORF2p的序列识别丧失特异性,最终将三联核苷酸重复序列不断插入至基因组的三联核苷酸重复序列中,引发相应疾病症状。

基于锐湃尔®REPERE®技术基础机制的亨廷顿舞蹈症和脆性X综合症的致病基因中的重复三联核苷酸序列的扩增机制(Sui, Y., & Peng, S. (2021). A Mechanism Leading to Changes in Copy Number Variations Affected by Transcriptional Level Might Be Involved in Evolution, Embryonic Development, Senescence, and Oncogenesis Mediated by Retrotransposons. Frontiers in cell and developmental biology9, 618113. https://doi.org/10.3389/fcell.2021.618113

另有一些研究结果或与锐湃尔®(REPERE®基础机制有关。有研究显示过量食用高糖的白米饭增加II型糖尿病的患病风险92-94,而同时逆转录抑制剂的使用可以有效减缓II型糖尿病的进展,结合II型糖尿病的不可逆性,提示其发病机制或与CNV的改变及锐湃尔®(REPERE®)基础机制相关。另外,体外培养的原代细胞,经一次或数次传代后,细胞的表型将发生明显改变,亦说明环境因素及细胞分裂对于细胞表型乃至于基因组应存在影响。

如此多的基因组变化现象,单靠现存的基因组重构主流学说——R环(R loop)学说是难以解释的。R环理论大多数的研究对象是基因组转录和复制普遍同时进行的原核细胞或单细胞真核生物,而对于由真核细胞构成的多细胞生物,其细胞在进行基因组复制前会对复制所需的蛋白进行大量转录表达,基因组复制和转录分别于不同时段进行,因此由基因组复制和转录冲突所形成的R环应是十分罕见的。所以应存在着另一种机制,使RNA得以转化为DNA,从而对基因组进行定向、多样且精细的重构,为胚胎发育提供基础,即锐湃尔®(REPERE®)基础机制。

值得注意的是,锐湃尔®(REPERE®)基础机制并非人体内第一个基于RNA逆转录并由细胞分裂进行调控的基因组重构机制。在此之前,人体内已有RNA经内源性逆转录酶逆转录为双链DNA,并随细胞分裂通过同源重组定向且特异的插入至基因组的先例,即端粒酶延长端粒的相关机制95,96。此外,在某些缺失端粒酶的物种中,转座子也可替代端粒酶进行端粒的延长97,98。端粒和端粒酶的相关研究于2009年获得诺贝尔奖。

 

锐湃尔®(REPERE®技术的理论基础6——锐湃尔®(REPERE®技术的安全性

虽然锐湃尔®(REPERE®)技术可以较为高效的对基因组进行重构,但只要保持LINE-1及ORF2p的表达量在生理范围内,即可保证较高的安全性。Alu元件和LINE-1在新生儿中的非预期插入率分别为每20个新生儿一个和每200个新生儿一个99,100,考虑到胚胎发育过程中细胞巨大的增殖量,Alu元件和LINE-1每次细胞分裂的非预期插入概率应该是极其低的;而对于增殖远没有那么迅速和频繁的成人,理论上则更低。

关于锐湃尔®(REPERE®基因编辑技术

锐湃尔®(REPERE®)应用人类基因组中的重复元件(Alu元件及LINE-1转座子)、人源核酸内切酶以及逆转录酶ORF2p,整个技术完全为人源,锐湃尔可识别基因组上待插入序列上游的长序列片段并剪切基因组靶位点的DNA单链,同时将含有待插入序列的RNA转化为双链DNA,最终经同源重组将待插入序列插入至基因组中。该技术由于仅在待插入位点处形成双链DNA、识别序列长以及完全为人源等特点,使得其具有高靶向性、低脱靶率及极低抗原性等优势,并可以较高效率向基因组插入长片段序列。同时,该技术所采用的核酸内切酶仅切开基因组单链,此后通过同源重组进行序列插入,极大的避免了使基因组发生双链断裂的风险,因此具有较高的安全性。

锐湃尔®REPERE®基因编辑技术的技术原理

参考文献:

1          Guo H, Karberg M, Long M et al. Group II introns designed to insert into therapeutically relevant DNA target sites in human cells. Science (New York, N.Y.). 2000;289(5478): 452-457. doi:10.1126/science.289.5478.452.

2          Guo H, Zimmerly S, Perlman PS et al. Group II intron endonucleases use both RNA and protein subunits for recognition of specific sequences in double-stranded DNA. The EMBO journal. 1997;16(22): 6835-6848. doi:10.1093/emboj/16.22.6835.

3          Jiménez-Zurdo JI, García-Rodríguez FM, Barrientos-Durán A et al. DNA target site requirements for homing in vivo of a bacterial group II intron encoding a protein lacking the DNA endonuclease domain. Journal of molecular biology. 2003;326(2): 413-423. doi:10.1016/s0022-2836(02)01380-3.

4          Singh NN ,Lambowitz AM. Interaction of a group II intron ribonucleoprotein endonuclease with its DNA target site investigated by DNA footprinting and modification interference. Journal of molecular biology. 2001;309(2): 361-386. doi:10.1006/jmbi.2001.4658.

5          Cousineau B, Lawrence S, Smith D et al. Retrotransposition of a bacterial group II intron. Nature. 2000;404(6781): 1018-1021. doi:10.1038/35010029.

6          Sullivan JC, Reitzel AM,Finnerty JR. A high percentage of introns in human genes were present early in animal evolution: evidence from the basal metazoan Nematostella vectensis. Genome informatics. International Conference on Genome Informatics. 2006;17(1): 219-229.

7          Lander ES, Linton LM, Birren B et al. Initial sequencing and analysis of the human genome. Nature. 2001;409(6822): 860-921. doi:10.1038/35057062.

8          Burnette JM, Miyamoto-Sato E, Schaub MA et al. Subdivision of large introns in Drosophila by recursive splicing at nonexonic elements. Genetics. 2005;170(2): 661-674. doi:10.1534/genetics.104.039701.

9          Kelly S, Georgomanolis T, Zirkel A et al. Splicing of many human genes involves sites embedded within introns. Nucleic acids research. 2015;43(9): 4721-4732. doi:10.1093/nar/gkv386.

10        Taggart AJ, DeSimone AM, Shih JS et al. Large-scale mapping of branchpoints in human pre-mRNA transcripts in vivo. Nature structural & molecular biology. 2012;19(7): 719-721. doi:10.1038/nsmb.2327.

11        Zhang Y, Zhang XO, Chen T et al. Circular intronic long noncoding RNAs. Molecular cell. 2013;51(6): 792-806. doi:10.1016/j.molcel.2013.08.017.

12        Panda AC, De S, Grammatikakis I et al. High-purity circular RNA isolation method (RPAD) reveals vast collection of intronic circRNAs. Nucleic acids research. 2017;45(12): e116. doi:10.1093/nar/gkx297.

13        Harris NL ,Senapathy P. Distribution and consensus of branch point signals in eukaryotic genes: a computerized statistical analysis. Nucleic acids research. 1990;18(10): 3015-3019. doi:10.1093/nar/18.10.3015.

14        Pan Q, Shai O, Lee LJ et al. Deep surveying of alternative splicing complexity in the human transcriptome by high-throughput sequencing. Nature genetics. 2008;40(12): 1413-1415. doi:10.1038/ng.259.

15        Wang ET, Sandberg R, Luo S et al. Alternative isoform regulation in human tissue transcriptomes. Nature. 2008;456(7221): 470-476. doi:10.1038/nature07509.

16        Li X ,Manley JL. Inactivation of the SR protein splicing factor ASF/SF2 results in genomic instability. Cell. 2005;122(3): 365-378. doi:10.1016/j.cell.2005.06.008.

17        Streva VA, Faber ZJ,Deininger PL. LINE-1 and Alu retrotransposition exhibit clonal variation. Mobile DNA. 2013;4(1): 16. doi:10.1186/1759-8753-4-16.

18        de Andrade A, Wang M, Bonaldo MF et al. Genetic and epigenetic variations contributed by Alu retrotransposition. BMC genomics. 2011;12(617. doi:10.1186/1471-2164-12-617.

19        Shibata Y, Kumar P, Layer R et al. Extrachromosomal microDNAs and chromosomal microdeletions in normal tissues. Science (New York, N.Y.). 2012;336(6077): 82-86. doi:10.1126/science.1213307.

20        Dillon LW, Kumar P, Shibata Y et al. Production of Extrachromosomal MicroDNAs Is Linked to Mismatch Repair Pathways and Transcriptional Activity. Cell reports. 2015;11(11): 1749-1759. doi:10.1016/j.celrep.2015.05.020.

21        Esnault C, Maestre J,Heidmann T. Human LINE retrotransposons generate processed pseudogenes. Nature genetics. 2000;24(4): 363-367. doi:10.1038/74184.

22        Dewannieux M, Esnault C,Heidmann T. LINE-mediated retrotransposition of marked Alu sequences. Nature genetics. 2003;35(1): 41-48. doi:10.1038/ng1223.

23        Maraia RJ, Driscoll CT, Bilyeu T et al. Multiple dispersed loci produce small cytoplasmic Alu RNA. Molecular and cellular biology. 1993;13(7): 4233-4241. doi:10.1128/mcb.13.7.4233-4241.1993.

24        Chu WM, Liu WM,Schmid CW. RNA polymerase III promoter and terminator elements affect Alu RNA expression. Nucleic acids research. 1995;23(10): 1750-1757. doi:10.1093/nar/23.10.1750.

25        Wallace N, Wagstaff BJ, Deininger PL et al. LINE-1 ORF1 protein enhances Alu SINE retrotransposition. Gene. 2008;419(1-2): 1-6. doi:10.1016/j.gene.2008.04.007.

26        Mathias SL, Scott AF, Kazazian HH, Jr. et al. Reverse transcriptase encoded by a human transposable element. Science (New York, N.Y.). 1991;254(5039): 1808-1810. doi:10.1126/science.1722352.

27        Häsler J ,Strub K. Alu elements as regulators of gene expression. Nucleic acids research. 2006;34(19): 5491-5497. doi:10.1093/nar/gkl706.

28        Cost GJ ,Boeke JD. Targeting of human retrotransposon integration is directed by the specificity of the L1 endonuclease for regions of unusual DNA structure. Biochemistry. 1998;37(51): 18081-18093. doi:10.1021/bi981858s.

29        Iafrate AJ, Feuk L, Rivera MN et al. Detection of large-scale variation in the human genome. Nature genetics. 2004;36(9): 949-951. doi:10.1038/ng1416.

30        Sebat J, Lakshmi B, Troge J et al. Large-scale copy number polymorphism in the human genome. Science (New York, N.Y.). 2004;305(5683): 525-528. doi:10.1126/science.1098918.

31        Redon R, Ishikawa S, Fitch KR et al. Global variation in copy number in the human genome. Nature. 2006;444(7118): 444-454. doi:10.1038/nature05329.

32        Korbel JO, Urban AE, Affourtit JP et al. Paired-end mapping reveals extensive structural variation in the human genome. Science (New York, N.Y.). 2007;318(5849): 420-426. doi:10.1126/science.1149504.

33        Kang X, Yu Q, Huang Y et al. Effects of Integrating and Non-Integrating Reprogramming Methods on Copy Number Variation and Genomic Stability of Human Induced Pluripotent Stem Cells. PloS one. 2015;10(7): e0131128. doi:10.1371/journal.pone.0131128.

34        Abyzov A, Mariani J, Palejev D et al. Somatic copy number mosaicism in human skin revealed by induced pluripotent stem cells. Nature. 2012;492(7429): 438-442. doi:10.1038/nature11629.

35        Vanneste E, Voet T, Le Caignec C et al. Chromosome instability is common in human cleavage-stage embryos. Nature medicine. 2009;15(5): 577-583. doi:10.1038/nm.1924.

36        Zhu P, Guo H, Ren Y et al. Single-cell DNA methylome sequencing of human preimplantation embryos.  2018;50(1): 12-19. doi:10.1038/s41588-017-0007-6.

37        Claycomb JM, Benasutti M, Bosco G et al. Gene amplification as a developmental strategy: isolation of two developmental amplicons in Drosophila. Developmental cell. 2004;6(1): 145-155. doi:10.1016/s1534-5807(03)00398-8.

38        Fischer U, Keller A, Voss M et al. Genome-wide gene amplification during differentiation of neural progenitor cells in vitro. PloS one. 2012;7(5): e37422. doi:10.1371/journal.pone.0037422.

39        Meinhardt G, Kaltenberger S, Fiala C et al. ERBB2 gene amplification increases during the transition of proximal EGFR(+) to distal HLA-G(+) first trimester cell column trophoblasts. Placenta. 2015;36(8): 803-808. doi:10.1016/j.placenta.2015.05.017.

40        Hannibal RL ,Baker JC. Selective Amplification of the Genome Surrounding Key Placental Genes in Trophoblast Giant Cells. Current biology : CB. 2016;26(2): 230-236. doi:10.1016/j.cub.2015.11.060.

41        Shao X, Lv N, Liao J et al. Copy number variation is highly correlated with differential gene expression: a pan-cancer study.  2019;20(1): 175. doi:10.1186/s12881-019-0909-5.

42        Henrichsen CN, Vinckenbosch N, Zöllner S et al. Segmental copy number variation shapes tissue transcriptomes. Nature genetics. 2009;41(4): 424-429. doi:10.1038/ng.345.

43        Fischer U, Backes C, Fehlmann T et al. Prospect and challenge of detecting dynamic gene copy number increases in stem cells by whole genome sequencing. Journal of molecular medicine (Berlin, Germany). 2019;97(8): 1099-1111. doi:10.1007/s00109-019-01792-y.

44        Chaignat E, Yahya-Graison EA, Henrichsen CN et al. Copy number variation modifies expression time courses. Genome research. 2011;21(1): 106-113. doi:10.1101/gr.112748.110.

45        Liang Q, Conte N, Skarnes WC et al. Extensive genomic copy number variation in embryonic stem cells. Proceedings of the National Academy of Sciences of the United States of America. 2008;105(45): 17453-17456. doi:10.1073/pnas.0805638105.

46        Martin SL. The ORF1 protein encoded by LINE-1: structure and function during L1 retrotransposition. Journal of biomedicine & biotechnology. 2006;2006(1): 45621. doi:10.1155/jbb/2006/45621.

47        Adeniyi-Jones S ,Zasloff M. Transcription, processing and nuclear transport of a B1 Alu RNA species complementary to an intron of the murine alpha-fetoprotein gene. Nature. 1985;317(6032): 81-84. doi:10.1038/317081a0.

48        Kerachian MA ,Kerachian M. Long interspersed nucleotide element-1 (LINE-1) methylation in colorectal cancer. Clinica chimica acta; international journal of clinical chemistry. 2019;488(209-214. doi:10.1016/j.cca.2018.11.018.

49        Whongsiri P, Goering W,Lautwein T. Many Different LINE-1 Retroelements Are Activated in Bladder Cancer.  2020;21(24). doi:10.3390/ijms21249433.

50        Percharde M, Lin CJ, Yin Y et al. A LINE1-Nucleolin Partnership Regulates Early Development and ESC Identity. Cell. 2018;174(2): 391-405.e319. doi:10.1016/j.cell.2018.05.043.

51        Ngamphiw C, Tongsima S,Mutirangura A. Roles of intragenic and intergenic L1s in mouse and human. PloS one. 2014;9(11): e113434. doi:10.1371/journal.pone.0113434.

52        Matsutani S. Links between repeated sequences. Journal of biomedicine & biotechnology. 2006;2006(1): 13569. doi:10.1155/jbb/2006/13569.

53        Ostertag EM, DeBerardinis RJ, Goodier JL et al. A mouse model of human L1 retrotransposition. Nature genetics. 2002;32(4): 655-660. doi:10.1038/ng1022.

54        Prak ET, Dodson AW, Farkash EA et al. Tracking an embryonic L1 retrotransposition event. Proceedings of the National Academy of Sciences of the United States of America. 2003;100(4): 1832-1837. doi:10.1073/pnas.0337627100.

55        Muotri AR, Chu VT, Marchetto MC et al. Somatic mosaicism in neuronal precursor cells mediated by L1 retrotransposition. Nature. 2005;435(7044): 903-910. doi:10.1038/nature03663.

56        Evenson DP, Darzynkiewicz Z,Melamed MR. Relation of mammalian sperm chromatin heterogeneity to fertility. Science (New York, N.Y.). 1980;210(4474): 1131-1133. doi:10.1126/science.7444440.

57        Pavlícek A, Jabbari K, Paces J et al. Similar integration but different stability of Alus and LINEs in the human genome. Gene. 2001;276(1-2): 39-45. doi:10.1016/s0378-1119(01)00645-x.

58        Grover D, Majumder PP, C BR et al. Nonrandom distribution of alu elements in genes of various functional categories: insight from analysis of human chromosomes 21 and 22. Molecular biology and evolution. 2003;20(9): 1420-1424. doi:10.1093/molbev/msg153.

59        Korenberg JR ,Rykowski MC. Human genome organization: Alu, lines, and the molecular structure of metaphase chromosome bands. Cell. 1988;53(3): 391-400. doi:10.1016/0092-8674(88)90159-6.

60        Filatov LV, Mamayeva SE,Tomilin NV. Non-random distribution of Alu-family repeats in human chromosomes. Molecular biology reports. 1987;12(2): 117-122. doi:10.1007/bf00368879.

61        Grover D, Mukerji M, Bhatnagar P et al. Alu repeat analysis in the complete human genome: trends and variations with respect to genomic composition. Bioinformatics (Oxford, England). 2004;20(6): 813-817. doi:10.1093/bioinformatics/bth005.

62        Khitrinskaya IY, Stepanov VA,Puzyrev VP. Alu Repeats in the Human Genome. Molecular Biology. 2003;37(3): 325-333.

63        Saeliw T, Tangsuwansri C, Thongkorn S et al. Integrated genome-wide Alu methylation and transcriptome profiling analyses reveal novel epigenetic regulatory networks associated with autism spectrum disorder.  2018;9(27. doi:10.1186/s13229-018-0213-9.

64        Colot V, Maloisel L,Rossignol JL. [DNA repeats and homologous recombination: a probable role for DNA methylation in genome stability of eukaryotic cells]. Journal De La Société De Biologie. 1999;193(1): 29.

65        Smith ZD, Chan MM, Humm KC et al. DNA methylation dynamics of the human preimplantation embryo. Nature. 2014;511(7511): 611-615. doi:10.1038/nature13581.

66        Guo H, Zhu P, Yan L et al. The DNA methylation landscape of human early embryos. Nature. 2014;511(7511): 606-610. doi:10.1038/nature13544.

67        Tang F, Barbacioru C, Bao S et al. Tracing the derivation of embryonic stem cells from the inner cell mass by single-cell RNA-Seq analysis. Cell stem cell. 2010;6(5): 468-478. doi:10.1016/j.stem.2010.03.015.

68        Guo F, Yan L, Guo H et al. The Transcriptome and DNA Methylome Landscapes of Human Primordial Germ Cells. Cell. 2015;161(6): 1437-1452. doi:10.1016/j.cell.2015.05.015.

69        Cohen S, Menut S,Méchali M. Regulated formation of extrachromosomal circular DNA molecules during development in Xenopus laevis. Molecular and cellular biology. 1999;19(10): 6682-6689. doi:10.1128/mcb.19.10.6682.

70        Cohen S, Yacobi K,Segal D. Extrachromosomal circular DNA of tandemly repeated genomic sequences in Drosophila. Genome research. 2003;13(6a): 1133-1145. doi:10.1101/gr.907603.

71        Fortune MT, Vassilopoulos C, Coolbaugh MI et al. Dramatic, expansion-biased, age-dependent, tissue-specific somatic mosaicism in a transgenic mouse model of triplet repeat instability. Human molecular genetics. 2000;9(3): 439-445. doi:10.1093/hmg/9.3.439.

72        Cleary JD, Tomé S, López Castel A et al. Tissue- and age-specific DNA replication patterns at the CTG/CAG-expanded human myotonic dystrophy type 1 locus. Nature structural & molecular biology. 2010;17(9): 1079-1087. doi:10.1038/nsmb.1876.

73        Lee JM, Zhang J, Su AI et al. A novel approach to investigate tissue-specific trinucleotide repeat instability. BMC systems biology. 2010;4(29. doi:10.1186/1752-0509-4-29.

74        Field M, Dudding-Byth T, Arpone M et al. Significantly Elevated FMR1 mRNA and Mosaicism for Methylated Premutation and Full Mutation Alleles in Two Brothers with Autism Features Referred for Fragile X Testing.  2019;20(16). doi:10.3390/ijms20163907.

75        Li SH, Schilling G, Young WS, 3rd et al. Huntington’s disease gene (IT15) is widely expressed in human and rat tissues. Neuron. 1993;11(5): 985-993. doi:10.1016/0896-6273(93)90127-d.

76        Cohn LB, Silva IT, Oliveira TY et al. HIV-1 integration landscape during latent and active infection. Cell. 2015;160(3): 420-432. doi:10.1016/j.cell.2015.01.020.

77        Maldarelli F, Wu X, Su L et al. HIV latency. Specific HIV integration sites are linked to clonal expansion and persistence of infected cells. Science (New York, N.Y.). 2014;345(6193): 179-183. doi:10.1126/science.1254194.

78        Wagner TA, McLaughlin S, Garg K et al. HIV latency. Proliferation of cells with HIV integrated into cancer genes contributes to persistent infection. Science (New York, N.Y.). 2014;345(6196): 570-573. doi:10.1126/science.1256304.

79        Su Y, Davies S, Davis M et al. Expression of LINE-1 p40 protein in pediatric malignant germ cell tumors and its association with clinicopathological parameters: a report from the Children’s Oncology Group. Cancer letters. 2007;247(2): 204-212. doi:10.1016/j.canlet.2006.04.010.

80        Harris CR, Normart R, Yang Q et al. Association of nuclear localization of a long interspersed nuclear element-1 protein in breast tumors with poor prognostic outcomes. Genes & cancer. 2010;1(2): 115-124. doi:10.1177/1947601909360812.

81        Slamon DJ. Studies of the HER-2/neu proto-oncogene in human breast cancer. Cancer investigation. 1990;8(2): 253. doi:10.3109/07357909009017573.

82        Slamon DJ, Godolphin W, Jones LA et al. Studies of the HER-2/neu proto-oncogene in human breast and ovarian cancer. Science (New York, N.Y.). 1989;244(4905): 707-712. doi:10.1126/science.2470152.

83        Lovekin C, Ellis IO, Locker A et al. c-erbB-2 oncoprotein expression in primary and advanced breast cancer. British journal of cancer. 1991;63(3): 439-443. doi:10.1038/bjc.1991.101.

84        O’Reilly SM, Barnes DM, Camplejohn RS et al. The relationship between c-erbB-2 expression, S-phase fraction and prognosis in breast cancer. British journal of cancer. 1991;63(3): 444-446. doi:10.1038/bjc.1991.102.

85        Paterson MC, Dietrich KD, Danyluk J et al. Correlation between c-erbB-2 amplification and risk of recurrent disease in node-negative breast cancer. Cancer Res. 1991;51(2): 556-567.

86        Niu D, Li L, Yu Y et al. Evaluation of Next Generation Sequencing for Detecting HER2 Copy Number in Breast and Gastric Cancers. Pathology oncology research : POR. 2020;26(4): 2577-2585. doi:10.1007/s12253-020-00844-w.

87        Wei M, Grushko TA, Dignam J et al. BRCA1 promoter methylation in sporadic breast cancer is associated with reduced BRCA1 copy number and chromosome 17 aneusomy. Cancer Res. 2005;65(23): 10692-10699. doi:10.1158/0008-5472.can-05-1277.

88        Kwon SM, Kim DS, Won NH et al. Genomic copy number alterations with transcriptional deregulation at 6p identify an aggressive HCC phenotype. Carcinogenesis. 2013;34(7): 1543-1550. doi:10.1093/carcin/bgt095.

89        Kuchenbaecker KB, Hopper JL, Barnes DR et al. Risks of Breast, Ovarian, and Contralateral Breast Cancer for BRCA1 and BRCA2 Mutation Carriers. Jama. 2017;317(23): 2402-2416. doi:10.1001/jama.2017.7112.

90        Copson ER, Maishman TC, Tapper WJ et al. Germline BRCA mutation and outcome in young-onset breast cancer (POSH): a prospective cohort study. The Lancet. Oncology. 2018;19(2): 169-180. doi:10.1016/s1470-2045(17)30891-4.

91        Jaeckle KA, Decker PA, Ballman KV et al. Transformation of low grade glioma and correlation with outcome: an NCCTG database analysis. Journal of neuro-oncology. 2011;104(1): 253-259. doi:10.1007/s11060-010-0476-2.

92        Hu EA, Pan A, Malik V et al. White rice consumption and risk of type 2 diabetes: meta-analysis and systematic review. BMJ (Clinical research ed.). 2012;344(e1454. doi:10.1136/bmj.e1454.

93        Bhavadharini B ,Mohan V. White Rice Intake and Incident Diabetes: A Study of 132,373 Participants in 21 Countries.  2020;43(11): 2643-2650. doi:10.2337/dc19-2335.

94        Ambati J, Magagnoli J, Leung H et al. Repurposing anti-inflammasome NRTIs for improving insulin sensitivity and reducing type 2 diabetes development.  2020;11(1): 4737. doi:10.1038/s41467-020-18528-z.

95        Shampay J ,Blackburn EH. Generation of telomere-length heterogeneity in Saccharomyces cerevisiae. Proceedings of the National Academy of Sciences of the United States of America. 1988;85(2): 534-538. doi:10.1073/pnas.85.2.534.

96        Sobinoff AP ,Pickett HA. Mechanisms that drive telomere maintenance and recombination in human cancers. Current opinion in genetics & development. 2020;60(25-30. doi:10.1016/j.gde.2020.02.006.

97        Danilevskaya ON, Arkhipova IR, Traverse KL et al. Promoting in tandem: the promoter for telomere transposon HeT-A and implications for the evolution of retroviral LTRs. Cell. 1997;88(5): 647-655. doi:10.1016/s0092-8674(00)81907-8.

98        Villasante A, de Pablos B, Méndez-Lago M et al. Telomere maintenance in Drosophila: rapid transposon evolution at chromosome ends. Cell cycle (Georgetown, Tex.). 2008;7(14): 2134-2138. doi:10.4161/cc.7.14.6275.

99        Xing J, Zhang Y, Han K et al. Mobile elements create structural variation: analysis of a complete human genome. Genome research. 2009;19(9): 1516-1526. doi:10.1101/gr.091827.109.

100      Cordaux R, Hedges DJ, Herke SW et al. Estimating the retrotransposition rate of human Alu elements. Gene. 2006;373(134-137. doi:10.1016/j.gene.2006.01.019.

其他新闻资讯

购物篮