• 761.27 KB
  • 2022-04-22 13:43:46 发布

双链DNA可能的几种局部拓扑结构.pdf

  • 10页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'中国科技论文在线http://www.paper.edu.cn#双链DNA可能的几种局部拓扑结构12*邓学工,邓学梅(1.东北大学理学院;52.中国农业大学动物科技学院)摘要:DNA双链的整体结构通常不是简单的线性结构,可能的结构非常丰富、复杂。本文认为无论多么复杂的结构都是由3种简单的局部结构构成的。分别称为T-结构、R-结构和Q-结构。这三种结构都来自所谓的Hollidayjunction。本文据此分析单链和双链DNA的可能10的拓扑结构,给出大片段回文以及大片段串联重复的可能的成因。指出这样结构的存在可能干扰了测序后的拼接工作。所以本文认为在拼接工作中要考虑到各种可能的结构,而不是单纯地追求完全线性的拼接。关键词:双链DNA;Holliday交叉;拓扑结构;基因组拼接。中图分类号:Q7115AsetofpossiblelocaltopologicalstructuresofdoublestrandDNA12DENGXuegong,DENGXuemei(1.CollegeofScience,North-eastUniversity,110819;202.DepartmentofAnimalScience,ChinaAgriculturalUniversity)Abstract:TheoverallstructureoftheDNAdoublestrandisusuallynotasimplelinearstructure.Thisstudyfoundthatnomatterhowcomplexthestructureiscomposedof3simplelocaltopologicalstructures,termedasT-structure,R-structureandQ-structure.Allthethreestructuresarederivedfromtheso-calledHollidayjunction.Inthispaper,weanalyzedthepossibletopologicalstructuresof25singlestrandedanddoublestrandedDNA.Wepredictedthepossiblecausesoflongpalindromeandtandemrepeatedfragmentsandpointedoutthattheexistenceofsuchastructuremayinterferetothesequenceassembling.Therefore,inthispaper,wesuggestconsideringofthevariouspossiblestructuresintheassemblingprocess,insteadofsimplypursuingthecompletelinearstructureofthegenome.Keywords:doublestrandDNA;Hollidayjunction;topologicalstructure;genomeassembling300引言半个世纪以前,Holliday提出了遗传重组的Holliday交叉模型。Holliday交叉(Hollidayjunction)又包括两种形式,一种是“十字交叉”(Four-wayJunction),一种则是“T交叉”35(Three-wayJunction)。这样的结构后来被证实,随后,关于它的讨论也越来越多[1-16]。双链DNA会出现不完全线性的结构,特别是在一些特殊的物理和化学的条件下,也出现在一些特殊的功能细胞中。但无论怎样,非线性的结构都是由于DNA发生断裂,并以与原来不同的方式重新链接在一起而形成的。可以想象的局部断裂-重接的可能方式本来就不多,而真实的DNA世界里,可以被接受的方式很可能会更少,但这不影响DNA整体结构有非常40丰富的可能性。如果我们认定DNA的双链和单链最基本的结构都应该是线性的,那么非线性的结构一定产生于一些非本源的单链链接。我们可以想象的方式大致有DNA的断裂点和其它处的断裂点发生新的链接;DNA在断开处发生复制,自由端与其它的复制自由端或断开端反向的链接。都可以想象为两段(可能在同一染色体,甚至也可能不同)双链DNA的基金项目:教育部博士点基金(2012000811049)作者简介:邓学工(1963-),副教授,计算信息学.E-mail:dengxuegong@mail.neu.edu.cn-1- 中国科技论文在线http://www.paper.edu.cnHolliday交叉。本文主要讨论发生在同一条染色体的情况。一来可以简化问题,二来也不失45一般性。单链DNA的拓扑结构很简单,只能是线性或者闭环——如果不考虑它们在空间中的纠缠。双链DNA则复杂得多,主要表现在单链之间的片段的序列关系复杂,甚至可能破坏了原来意义上的双链对偶关系。非线性的双链结构在一些功能细胞中可以保持原有的功能,但在细胞分裂的时候会遇到难题,所以需要在分裂前恢复基本的线性结构。在恢复的过程中,50有可能由于十字交叉的对称性,使得原来的序列关系被打破,这就是所谓的重组。也可能有部分的片段脱落,也可能伴随有复制过程,这就可能使得长度发生变化,如果长度的增加都来自染色体本身,就会产生重复。而重复如果是连续发生的,就是所谓的串联重复。如果一个大片段的对偶链刚好和自己发生首尾相接,那就是所谓的回文。本文试图用可以形成的Holliday过程,解释这些现象的发生。至少是给出一种可能的解释。55那么如果DNA的非线性结构很复杂,测序后的拼接就会很麻烦,我们可能不再能够期待一个完全线性的拼接,而是会得到需要复杂结构注释的序列片段。即便是人们熟悉的十字交叉和T交叉(图1)的局部结构,都不能用线性序列很好地描述。如果还有更复杂的结构,那么我们目前在数据库中呈现的DNA数据就可能是有先天缺陷的。回文结构就是一例,一般我们认为回文是由于一对对偶片段首位链接而成[17-20],而60在线性序列里有可能忽略了这些。本文试图探索到底有多少可能的结构构成方式,进而说明,DNA的所有可能的结构都是由很少的几种构成方式组合形成的。65图1.基因组十字交叉和T交叉结构示意首先,我们将问题简化为DNA只有在双链的不同位置接触上的时候会发生断裂,然后以与原来不一样的方式重新链接。然后,我们又将问题限制在一个DNA链上。也就是说只70讨论一个链独自可以产生的结构。这样虽然对问题做了简化,但不影响对DNA可能的拓扑结构的讨论。1结果1.1Hollidayjunction后的拓扑结构,单链和双链本文主要讨论在一条染色体DNA自交叉时发生可能发生的Holliday交叉类型,以及在75交叉处发生某种局部的复制过程后可能产生的新的类型。Holliday交叉解开后,新的单链和双链与原始链的结构比较以及在染色体完全复制的时候,可能的新染色体与原始染色体之间-2- 中国科技论文在线http://www.paper.edu.cn所发生的重组关系。当然最重要的还是拓扑结构。所以后文各图中的DNA模拟图更多的是考虑拓扑结构和单链之间的片段排序关系,图中长短是没有意义的。颜色是为了解释形成交叉过程中,DNA的每个单链的局部片段的位置变化。801.2一次自交叉Hollidayjunction过程在一个双链DNA上,两个不同位点可能出现接触或交叉。在这样的点上,如果有剪切酶的作用出现断裂,会出现单链的自由端,这些自由端就有可能出现错接的现象,当然是一个断裂链的一个3’端和另一个链的5’端链接。在一个双链交叉处发生一次这样的重接的模式可以分为三类(图2)。第一类,每个双链都各自断开一个单链。第二类,一个双链位点85断开两个单链而另一个位点只断开一个单链。第三类,是两个位点都在接触位点全部断开重新链接。当然指的都是每一个断开后不再接回到原来的状态。这些动作其实都是大家熟知的Holliday交叉[1-16]。第一类交叉,分为两种情况,两个断开都发生在同一单链上和两个断开发生在不同的单链上。前者如图2.1-2,两者双链拓扑结构中都会出现一个闭环,但前者会出现一个单链的90闭环,而后者没有。我们分别将这两种交叉(junction)叫做R-junction和Q-junction。第二类交叉,由于断开的三个单链的六个自由端都不能和原配的自由端链接。所以只有一种可能,就是形成一个T交叉。同时形成一个帽环结构,如图2.3。虽然这样形成一个帽环结构的过程未见报道,但作为一种可能性,也放在这里。其它的任何重接方式都不可被免地有一条单链接回原来状态变成第一类。95第三类交叉,看上去可能的重接方式比较多,因为有八个自由端。按3’和5’的方式自由链接可能的方式很多(24种)。但多数会是属于第一第二类。可能的结构只有3种,如图2.4-6。其中图2.4相当于一个闭环从主链上脱落,如果在别处仍与主链链接,我们另做讨论。图2.5相当于一次Holliday重组,双链还是线性的,不在讨论之列。图2.6还是一个R-junction,只是自由端的重接方式比图2.1稍微复杂,可能也更不容易实现。100综上可见,一次Holliday交叉只能形成三种结构,R-junction,Q-junction和T-junction。-3- 中国科技论文在线http://www.paper.edu.cn图2.一次Hollidayjunction的所有可能的结构拓扑图1051.3多次自Hollidayjunction过程多个Holliday交叉同时或顺序发生在一条染色体上,情况变得比较复杂,但仅仅两个就没有太多的可能性。我们就讨论两个的情况。类似前图,我们用红色、暗红色、橙色和粉色表示原始的Watson链,用墨绿色,绿色,黄绿色和淡蓝色表示原始的Crick链。这完全是为了说明junction形成的过程。考虑到Watson链和Crick链的对称性,对彼此可以对称变换110的结构不加区分。两个十字交叉同时发生,最后的结构显然与它们的位置关系相关,也和junction的种类相关。如果两个junction都没有发生在对方所产生的闭环上,情况就简单了,我们称之为第一类(图3,1.1-1.6);如果一个junction发生在另一个junction产生的双链闭环上和环外的交叉,我们称之为第二类(图3,2.1-2.6);如果一个junction产生于另一个junction闭115环内,我们称之为第三类(图3,3.1-3.6)。由于每一类中的两个junction都可能是R型和Q型的,而且可能发生在不同的单链上,所以每一类都有六种可能。图3列出了所有可能的18种双junction的拓扑图。其中表示Q结构时,我们绘制的交叉和图2中的Q-结构是拓扑一致的,真实的空间结构也应该如图1中的结构,本文中的图为了绘制方便,所以只考虑拓扑结构的可能性。120实际上所有这些结构都是不稳定的,可能在它们复制到下一代之前,所有的junction都会解开,双链都变成线性。但由于解开的方式不同,所有的单链都有可能得到保留,或在某junction处被断开。也就是说,图中的所有单链都可能出现在下一代的DNA中,也有可能不会出现。可能出现在下一代DNA序列中的单链当然还不止这些。即便是两个十字交叉,断开重125接的方式就有多种,这还不算形成颈环结构。其中一种是恢复原来状态,此外还有两种。我-4- 中国科技论文在线http://www.paper.edu.cn们研究这些方式的可能性就是为了解释我们最后在单链DNA上看到的各种重组、重复和缺失。由于可能性太多,本文不对其一一列出,图3只是两个junction的所有可能位置关系,从上面可以看到所有可能的单链组成和原始链的关系。在只有R-junction的情况下,多数会出现单链的闭环。由于结构简单,可以通过对图的130观察而完全了解。图中暗红色和墨绿色表示单链闭环。只有图3.2.1除外,在任何一个单链上看,都是发生了一次转位重组。在有Q-junction的时候,在两个junction之间会出现片段的两个对偶链都在一个单链的情况。当然,这样的片段的两个单链片段实际上就是一对对偶的片段。在单链上看,相当于一个倒位(invertedtransposition),如果两个对偶片段的间距非常小,甚至没有缝隙,就很像所谓的回文。比如图3.1.5的一个单链就是由3对对偶的片135段构成,而图3.2.6的一个单链是由两个对偶片段构成,只是这两个对偶片段之间有一个片段的插入。这样的类似构成在灵长目的Y染色体基因组中都有发现[17,21-25]。所有这些关于单链上的结构分析都是基于任何一个单链都有机会保留到下一代,或者在测序的时候没有被破坏这一前提。-5- 中国科技论文在线http://www.paper.edu.cn140图3.两个十字交叉(Fourwayjunction)时所有可能出现的DNA拓扑结构。墨绿色和暗红色的片段表示单链闭环。绿色-红色双链片段表示该片段的两个对偶链不在同一单链上。其它的三种双链片段淡蓝-粉色、橙色-淡绿色和黄色-大红色的双链片段均表示对偶的片段在同一单链上。1.4在Hollidayjunction处发生局部的复制过程Hollidayjunction不会在DNA中产生任何新的片段,只是在原来的DNA上产生重组。145虽然仅仅通过junction过程可以产生回文单链,但不会产生任何的新重复序列,包括串联和-6- 中国科技论文在线http://www.paper.edu.cn非串联的重复序列。任何的重复一定是产生于一个局部的复制过程。在十字交叉的交岔点处,包括R-junction和Q-junction,如果启动一个片段的复制过程,从某一个junction处开始,回到该junction或到另一个junction处结束,这时,可以产生一些单链的自由端,包括由复制产生的,也包括junction的某个链断开产生的。这些自由端寻150找一个方便的,匹配的自由端可以重新链接形成新的结构。我们会看到串联重复的一个可能的过程,同时也可以看到真正的回文产生的过程。但这样的链接在物理和数学来说会有非常多的可能性,本文仅举几例,它们是最有可能出现的几种。在junction处,如果启动一个复制过程,由于本来就有的四个单链和新产生的两个单链都经过junction,可能的断开-重接的方式很多。这样,在数学上的可能性,甚至物理的可能155性会很多。但有些过程似乎不太可能发生在真实的生物过程中。所以我们只例举几种最可能发生的情况。一个复制过程以R-junction的绿色闭环为模板,起始于junction处。红色的链脱离出来,配上对偶的蓝色链,绿色链产生对偶的紫色链。复制完成后,一个闭环脱落下来,但剩下的是和原来一般无二的一个,一个R-structure。这个脱落的闭环可以降解掉,也可以在其它位置160在形成一个新的junction。而这样的junction可能再解开变成一个junction的结构,这个新junction也会在适当的时候解开,这相当于一次转座。这个转座过程有一个有趣的可能性,就是掉落的闭环在形成新的junction的时候,可能不在原来的位点上,这样当这个新的R-junction解开后,相对于原来的片段做了一个在片段内部的前后次序的一个transposition(图4.1.1)。165相似的复制发生在一个Q-junction处时,会出现图4.2.1-图4.2.3中的结构。虽然这样的结构的形成很容易,但同样是在R-junction处开始一个复制过程,但发生复制后,重接的方式如图4.2.2,则会形成一个新的R-junction,但R-闭环双链已经发生了一次倍增,也即新R-双链闭环是原来闭环的一个自我的串联重复,这样的过程可能就是形成长串联重复的一种方式。如果仅仅因为主链和闭环在自由端链接的时候稍有不同,新的R-结构将出现一个回170文单链,解开以后就是一个回文。这样的过程可能是长回文的可能形成过程。和前例很相似,但由于绿链断开和复制过程中形成的紫链的两个自由端形成一个新的R-junction,最后的结果是闭环虽然形成一个拷贝,但没有脱落,这样的过程不断重复,就形成了一个严格首尾相接的串联重复。这样的串联重复在真实的基因组中多有出现。如果非常长的回文,不可能是偶然的,回文的两个片段应该是来自某个时候的某个片段的对偶链。175T-结构就有这样的条件,只需如图4.2.3的简单过程。只是这样长的T-结构可否如图形成还未见报道。-7- 中国科技论文在线http://www.paper.edu.cn图4.在一个R-junction或一个Q-junction处开始一个复制过程,在回到junction处结束。几种可能的结构图例。1801.5长串联重复、长回文以及多拷贝转座与Hollidayjunction的可能关系关于长串联重复、回文以及多拷贝转座的形成已经有过很多的讨论,本文给出一种可能的形成过程。首先,这三种结构都属于重复结构,都能通过简单的junction和局部的复制过程出现在单链上,也就是说可以打开junction之后出现在一个线性的双链上。回文的定义是一个片段和它的一个倒位(inversion)的串联,在真实的情况里,回文的185间隔有时较小,甚至没有间隔,它们可能如图2.3中的T交叉(threewayjunction)或图4.2.3中的方式形成。有时回文间隔(环)较大,可能由图3中的很多方式形成。而多个片段和它们的倒位片段串联的情况可能是由图3中的几个情况导致。在图4.2.2中,一个R-junction的闭环启动一个简单的复制就产生了一个在主链上的闭环的拷贝,而且原来的闭环还在,这样的过程多次重复就自然形成一个长串联重复。而所有190的动作在DNA的重组过程中都有发生。长串联重复应该是在一代完成的,很难想象有那样一个位点,隔代保持一种活性,去重复上一代的一个拷贝复制,而且经过几代之后,这种活性又消失了。图中4.1.1中,一个R-junction处,发生了一个和前者相似的复制过程,只是-8- 中国科技论文在线http://www.paper.edu.cn在自由端链接上和前者稍有不同,产生了一个闭环脱落,在脱落之前已经在主链上留下了一个自己的拷贝。这个闭环游离于染色体主链,可能在某个位置和DNA主链又形成一个新的195Hollidayjunction,重复这个过程,又在那里留下一个拷贝,然后有脱落,或者,在游离状态下,自我形成多个拷贝。这个过程与一个线性片段脱落没有太大区别,但是如果这个闭环在与其它位置形成junction的时候,没有在原来的闭环位置上,就形成了一个又一个转座后的拷贝。我们在斑马鱼的基因组DNA上发现很多这样的实例。在上述各种结构中,只要单链在某一段上往返,该单链就是回文。尽管和一般意义上的回文200定义有一点出入。在人的y染色体上,大段的回文到处都是,但中间都有一些片段插入,虽远远小于回文本身,但这个区别是明显的,这样的回文可能产生于图3.1.5和图2.2.6中的过程,而不是图2.3中的。回文的产生和Q-junction有关,在没有Q-junction的结构中,不可能产生回文2结论与讨论205在基因组DNA测序的时候,DNA可能还保留有某种junction结构。这使得DNA的单链之间不是处于完全对偶的状态,即便只有两个单链,当然可能会多于两个。由于测序不可能完全针对一个单链,因为我们无法搞到一个单链,使得我们在序列拼接时可能遇到麻烦,也许我们没有注意到这个麻烦。如果在绝对理想的状态下,由于我们对序列做了很多个倍数的测序,我们有理由将其拼接起来(当然这其中的技术困难很多)。但如果有junction存在,210而我们又一定要拼接出一个完全线性的序列,那就可能在不同的参数下得到不同的结果。也就是说我们在众多的错误中选择了其中一个。虽然我们可以期待这样的情况并不多,但如果存在,我们是否可以识别出它们。如果还要认定junction可能存在,那么拼接的工作就会变得比以前更复杂,尽管不考虑这些已经很复杂了。DNA双链的整体空间结构可以是非常复杂的,但无论多么复杂,都是通过有限次的T,215R,Q-结构变化得来的。也就是说这三种变化是DNA结构变化的基本元,或称为生成元。通过这样的三种junction过程,可以生成我们熟悉的长串联重复、回文和长转座重复。形成这些结构的过程都是通过简单的junction与junction分解完成的,而这样的过程的存在是显而易见的。所以,通过这样的过程形成上述结构也应该必然的。R-结构和T-结构和十字结构、T结构的形成原理是完全一样的,只是前者一定是发生在220单一的DNA双链上。既然后者可以存在,那么前者的存在是没有问题的。对于这样的结构的研究很可能将帮助人们更好地完成拼接工作,因为至今未拼接的部分很可能是由于假设了完全线性而遇到的逻辑困境。[参考文献](References)225[1]OleksiA,BlancoAG,BoerR,etal.MolecularRecognitionofaThree‐WayDNAJunctionbyaMetallosupramolecularHelicate.AngewandteChemie,2006,118(8):1249-1253.[2]Stahl.TheHollidayjunctiononitsthirtiethanniversary.Genetics,1994,138(2):241-246.[3]IrvoasJ,NoirotA,Chouini-LalanneN,etal.DNAthree-wayjunction-rutheniumcomplexassemblies.NewJournalofChemistry,2013,8:2324-2329.230[4]LiuY,WestS.HappyHollidays:40thanniversaryoftheHollidayjunction.NatRevMolCellBiol,2004,5(11):937-44.[5]LoJ.,VanGentD.,HelledayT.,EngelwardB.Double-StrandBreakRepairviaDoubleHollidayJunctions-9- 中国科技论文在线http://www.paper.edu.cn(SzostakModel).MassachussettsInstituteofTechnology,2007.MITPress.[6]ZlatanovaJ,VanHoldeK.Bindingtofour-wayjunctionDNA:acommonpropertyofarchitecturalproteins?.235TheFASEBjournal,1998,12(6):421-431.[7]McKinneySA,DéclaisAC,LilleyDMJ,etal.StructuraldynamicsofindividualHollidayjunctions.Naturestructuralbiology,2003,10(2):93.[8]CromieGA,HyppaRW,TaylorAF,etal.SingleHollidayjunctionsareintermediatesofmeioticrecombination.Cell,2006,127(6):1167-1178.240[9]BizardAH,HicksonID.ThedissolutionofdoubleHollidayjunctions.ColdSpringHarborperspectivesinbiology,2014,6(7):a016477.[10]MatosJ,WestSC.Hollidayjunctionresolution:Regulationinspaceandtime.DNArepair,2014,19:176-181.[11]HaysFA,WatsonJ,HoPS.Caution!DNACrossing:CrystalStructuresofHollidayJunctions.JBiolChem,2452003,278(50):49663-49666.[12]FuTJ,Tse-DinhYC,SeemanNC.Hollidayjunctioncrossovertopology.J.Mol.Biol.1994,236(1):91-105.[13]NowakowskiJ,ShimPJ,StoutCD,etal.AlternativeconformationsofAsetofpossibletopologicalstructuresofdoublestrandedDNAanucleicacidfour-wayjunction.Journalofmolecularbiology,2000,300(1):93-102.250[14]MikheikinAL,LushnikovAY,LyubchenkoYL.EffectofDNAsupercoilingonthegeometryofhollidayjunctions.Biochemistry,2006,45(43):12998-13006.[15]DuckettDR,MurchieAIH,DiekmannS,etal.ThestructureoftheHollidayjunction,anditsresolution.Cell,1988,55(1):79-89.[16]SchwachaA,KlecknerN.IdentificationofdoubleHollidayjunctionsasintermediatesinmeiotic255recombination.Cell,1995,83(5):783-791.[17]PilleHallast,PatriciaBalaresque,GeorginaR.Bowden,StéphaneBallereau,MarkA.Jobling.RecombinationdynamicsofahumanY-chromosomalpalindrome:rapidGC-biasedgeneconversion,multi-kilobaseconversiontracts,andrareinversions.PlosGenetics,2013,9(7):e1003666.[18]AkgünE,ZahnJ,BaumesS,etal.Palindromeresolutionandrecombinationinthemammaliangermline.260Molecular&CellularBiology,1997,17(9):5559-70.[19]ElhaiJ,WolkCP.Aversatileclassofpositive-selectionvectorsbasedonthenonviabilityofpalindrome-containingplasmidsthatallowscloningintolongpolylinkers.Gene,1988,68(1):119-38.[20]LeachDR,StahlFW.Viabilityoflambdaphagescarryingaperfectpalindromeintheabsenceofrecombinationnucleases.Nature,1983,305(5933):448.265[21]HallastP,BalaresqueP,BowdenGR,etal.RecombinationdynamicsofahumanY-chromosomalpAsetofpossibletopologicalstructuresofdoublestrandedDNAalindrome:rapidGC-biasedgeneconversion,multi-kilobaseconversiontracts,andrareinversions.PLoSgenetics,2013,9(7):e1003666.[22]JoblingMA,Tyler-SmithC.ThehumanYchromosome:anevolutionarymarkercomesofage.NatureReviewsGenetics,2003,4(8):598-612.270[23]HallastP,BalaresqueP,BowdenGR,etal.RecombinationdynamicsofahumanY-chromosomalpalindrome:rapidGC-biasedgeneconversion,multi-kilobaseconversiontracts,andrareinversions.PLoSgenetics,2013,9(7):e1003666.[24]WangJ,NaJK,YuQ,etal.SequencingpapayaXandYchromosomesrevealsmolecularbasisofincipientsexchromosomeevolution.ProceedingsoftheNationalAcademyofSciences,2012,109(34):13710-13715.275[25]SohYQS,AlföldiJ,PyntikovaT,etal.SequencingthemouseYchromosomerevealsconvergentgeneacquisitionandamplificationonbothsexchromosomes.Cell,2014,159(4):800-813.-10-'