• 1.01 MB
  • 2022-04-22 13:43:45 发布

棉花XTH基因家族全基因组鉴定及进化分析.pdf

  • 16页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'中国科技论文在线http://www.paper.edu.cn棉花XTH基因家族全基因组鉴定及进化分析#安亚茹,杨君,刘正文,张桂寅,马峙英,王省芬**5(教育部华北作物种质资源重点实验室/河北省作物种质资源重点实验室/河北农业大学,河北保定071001)摘要:本研究从亚洲棉、雷蒙德氏棉和陆地棉基因组中分别鉴定出37、39和72个XTH家族基因,编码木葡聚糖内转糖苷酶/水解酶(xyloglucanendotransglycosylase/hydrolase,XTH),10分别命名为GaXTH01-GaXTH37、GrXTH01-GrXTH39和GhXTH01-GhXTH72,分析其基因结构、染色体定位、同源基因、保守基序、系统进化、理化性质、亚细胞定位和陆地棉顺式作用元件。结果表明XTH广泛分布在棉花染色体上;亚洲棉、雷蒙德氏棉与陆地棉基因同源性较高;所有的XTHs都有6个保守基序,保守性较强;多数XTH蛋白定位在细胞壁。根据亚洲棉、雷蒙德氏棉、陆地棉和拟南芥XTH构建的系统发育树,将XTH家族基因分15为两组,27对亚洲棉与陆地棉XTH基因、25对雷蒙德氏棉与陆地棉XTH基因位于进化树末端分支,该结果符合目前普遍公认的雷蒙德氏棉和亚洲棉是四倍体棉花的祖先。上述结果为研究XTH基因家族的功能提供了参考。关键词:亚洲棉;雷蒙德氏棉;陆地棉;木葡聚糖内转糖苷酶/水解酶基因家族;进化中图分类号:S562.32120Genome-wideIdentificationandEvolutionaryAnalysisofXTHGeneFamilyinCottonANYaru,YANGJun,LIUZhengwen,ZHANGGuiyin,MAZhiying,WANGXingfen25(NorthChinaKeyLaboratoryforCropGermplasmResourcesofEducationMinistry/KeyLaboratoryforCropGermplasmResourcesofHebei/HebeiAgriculturalUniversity,Baoding,071000,China)Abstract:Inthisstudy,37,39and72XTHgenesencodedxyloglucanendotransglycosylase/hydrolasewereidentifiedinGossypiumarboreum,G.raimondiiandG.hirsutumgenomeandnamed30GaXTH01-GaXTH37,GrXTH01-GrXTH39andGhXTH1-GhXTH172,respectively.Theirgenestructure,evolutionaryrelationship,conservativemotif,physicochemicalproperties,subcellularlocationwereanalyzed,andcis-actingelementsofXTHsfromuplandcottonwereanalyzed.TheresultsshowedthatthepredictedXTHgenesofcottonwerewidelydistributedacrossthechromosomes.TheXTHgenesofG.arboreum,G.raimondiiandG.hirsutumhadhighhomology.XTHswere35classifiedintotwogroupsaccordingtothephylogenicrelationshipandgenestructure.XTHshadsixhighlyconservedmotifsandmostofXTHsexistedincellwall.AccordingtophylogenetictreeofXTHaminoacidsequencesofG.raimondii,G.arboreum,G.hirsutumandArabidopsisthaliana,theyweredividedintotwogroups.Twenty-sevenpairsXTHgenesfromG.arboreumandG.hirsutumand25pairsXTHgenesfromG.raimondiiandG.hirsutumwerelocatedattheterminalbranchsof40phylogenetictree.ThisphenomenonisconsistentwiththeevolutionaryrelationshipthatG.arboreumandG.raimondiiaretheancestorsoftetraploidcottonvarieties.TheaboveanalysesprovideusefulreferenceforfurtherstudyonfunctionoftheXTHgenefamily.Keywords:Gossypiumarboreum;Gossypiumraimondii;Gossypiumhirsutum;XTHgenefamily;evolution45基金项目:国家转基因生物新品种培育科技重大专项(2016ZX08005-003),河北农业大学作物学科梯队建设基金(TD2016C201)作者简介:安亚茹,女,硕士研究生,遗传学通信联系人:王省芬,女,教授,研究方向:作物遗传育种.E-mail:cotton@hebau.edu.cn-1- 中国科技论文在线http://www.paper.edu.cn0引言在生物细胞壁中,木葡聚糖(xyloglucan,XyG)与纤维素微纤丝通过共价作用力交联在一起,是初生壁主要承重结构,与调控细胞的延展等生理过程密切相关[1]。木葡聚糖与细胞50壁的合成相关,是植物次生壁的主要组成成分,它含量的多少关系到消化酶对纤维素的降解。木葡聚糖内转糖苷酶/水解酶(xyloglucanendotransglycosylase/hydrolase,XTH)能够降解木葡聚糖,在不同分子之间转移糖基[2],其水解酶破坏纤维素-木葡聚糖的连接结构,从而破坏细胞壁的结构,这种破坏是单向且不可恢复[3]。然而,转糖基酶不仅不损坏细胞壁结构,而且能使细胞壁的结构发生变化,促进细胞扩展。55XTH属于多基因家族,基因家族有相似的基因结构和功能,编码相似的基因产物。在进化过程中,祖先基因通过基因复制、分化产生的基因,可能串联地分布在同一条染色体,也有可能分散在不同的染色体上,参与相同或不同的表达调控模式。XTH蛋白包括一个高度保守的区段,是DEIDFEFLG,还包括四个半胱氨酸,可形成二硫键,具有XTH活性的序列具有高度的相似性[4-6]。由于XTH蛋白具有木葡聚糖内糖基转移酶(xyloglucan60endotransglycosylase,XET)和木葡聚糖水解酶(xyloglucanhydrolase,XEH)双重活性,使其命名比较混乱和矛盾,在2001年召开的第九次国际细胞壁会议中,讨论并通过了统一的命名,这类基因的任何成员都被称为木葡聚糖内糖基转移酶/水解酶,并确定了拟南芥基因组中包含33个该基因家族成员[7],为进一步研究其他物种中的XTH基因奠定了基础。目前,二倍体亚洲棉、雷蒙德氏棉和四倍体陆地棉的基因组测序结果已经公布[8-11],这65为挖掘基因家族提供了重要的基因组资源。本研究就是基于亚洲棉、雷蒙德氏棉和陆地棉基因组测序数据库,利用hmmsearch[12]软件,以XTH基因家族蛋白保守结构域PF00722和PF06955为探针搜索数据库中的XTHs序列,在全基因组水平鉴定二倍体和四倍体的XTH基因家族成员,分析其基因结构、保守基序、系统进化、理化性质,并进行亚细胞定位预测,为研究棉花XTH基因家族的功能提供参考依据。701材料与方法1.1XTH基因家族序列搜索亚洲棉、雷蒙德氏棉和陆地棉基因组数据库分别是从中棉所、Phytozome(http://www.phytozome.net/)和Cottongen(https://www.cottongen.org/)下载。从Pfam数据库(http://pfam.sanger.ac.uk/)下载XTH保守结构域文件PF00722和PF06955,利用本地75HMMER软件搜索亚洲棉、雷蒙德氏棉和陆地棉蛋白数据库,参数为默认值[12]。将获得的候选蛋白分别通过在线软件SMART(http://smart.embl-heidelberg.de)和CDD(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi),验证是否具有XTH保守结构域。若存在XTH结构域,则认为该候选蛋白属于XTH蛋白。依据它们所在染色体对其命名。1.2XTH基因家族的聚类和基因结构分析80利用分子进化分析软件Bioedit的ClustalW程序对37个亚洲棉、39个雷蒙德氏棉和72个陆地棉XTH基因序列进行比对,采用相邻连接法(Neighbor-joining,NJ)构建系统发育树[13]。利用基因结构显示系统GSDS(http://gsds.cbi.pku.e-du.cn/)分析基因结构特征,绘制基因结-2- 中国科技论文在线http://www.paper.edu.cn构图[14]。1.3基因定位与共线性分析85将所有的XTH基因序列进行比对,两个基因序列比对长度大于80%,比对分值大于90%,则认为这两个序列是同源基因,具有共线性。利用circos作图软件,根据基因的位置信息,将同源基因用线条连接起来[15]。1.4亚洲棉、雷蒙德氏棉与陆地棉XTHs家族保守基序分析利用在线软件MEME(http://meme-suite.org/tools/meme)分析比对37个亚洲棉、39个90雷蒙德氏棉和72个陆地棉XTHs氨基酸序列,得到保守基序[16]。1.5亚洲棉、雷蒙德氏棉、陆地棉与拟南芥XTHs的系统进化分析利用分子进化分析软件Bioedit的ClustalW程序对37个亚洲棉、39个雷蒙德氏棉和72个陆地棉和33个拟南芥XTH氨基酸序列(http://www.arabidopsis.org/)进行比对,采用相邻连接法(Neighbor-joining,NJ)构建系统发育树。951.6亚洲棉、雷蒙德氏棉与陆地棉XTHs理化性质和亚细胞定位利用在线软件ProtParam(http://web.expasy.org/protparam/)对基因家族成员的氨基酸数量、分子量、等电点等理化性质进行预测[17]。通过在线的亚细胞定位预测网站Euk-mPLoc2.0(http://www.csbio.sjtu.edu.cn/bioinf/euk-multi-2/),对所有的XTH蛋白质序列进行亚细胞定位预测,确定XTHs蛋白的亚细胞位置[18]。1001.7陆地棉XTHs启动子序列分析利用perl语言程序,根据注释数据库的基因注释信息,从陆地棉基因组中提取起始密码子上游的1500bp的碱基序列,利用plantcare(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)进行检索[19],从而预测并分析XTHs上游区域存在的启动子。2结果与分析1052.1雷蒙德氏棉、亚洲棉和陆地棉XTH基因家族成员的鉴定与命名利用hmmsearch软件,分别搜索雷蒙德氏棉、亚洲棉和陆地棉基因组数据库,获得候选序列。将候选序列提交到SMART和NCBICDD数据库,从亚洲棉、雷蒙德氏棉和陆地棉中分别鉴定得到37、39和72个XTH家族基因成员。依据各基因所在的染色体(从第1号染色体到第13号染色体再到scaffold)对其命名,即GaXTH01-GaXTH37、GrXTH01-GrXTH39110和GhXTH01-GhXTH72。115-3- 中国科技论文在线http://www.paper.edu.cn表1亚洲棉XTH基因家族信息120Tab.1InformationofXTHgenefamilyinG.arboreum基因ID基因名字染色体定位基因ID基因名字染色体定位GeneIDGenenameGenelocalizationGeneIDGenenameGenelocalizationCotton_A_33572GaXTH01A01:19527843:19529687Cotton_A_07936GaXTH20A06:50166213:50167607Cotton_A_16721GaXTH02A02:60576898:60578051Cotton_A_10837GaXTH21A06:57082222:57083344Cotton_A_09738GaXTH03A03:35947794:35950066Cotton_A_38736GaXTH22A07:7626788:7628056Cotton_A_09804GaXTH04A03:36930327:36931437Cotton_A_04223GaXTH23A07:78710461:78712001Cotton_A_06765GaXTH05A03:52367547:52368559Cotton_A_16901GaXTH24A08:105292868:105293885Cotton_A_06766GaXTH06A03:52419990:52420959Cotton_A_16900GaXTH25A08:105296978:105298043Cotton_A_06767GaXTH07A03:52434159:52435167Cotton_A_18873GaXTH26A08:3575131:3576688Cotton_A_06771GaXTH08A03:52502065:52503074Cotton_A_27431GaXTH27A08:81974049:81975647Cotton_A_35994GaXTH09A03:65905292:65905651Cotton_A_03972GaXTH28A09:62226927:62228475Cotton_A_05152GaXTH10A03:88723761:88726464Cotton_A_29676GaXTH29A10:109120717:10912210Cotton_A_05092GaXTH11A03:89551238:89553477Cotton_A_11057GaXTH30A10:21692004:21693053:Cotton_A_05091GaXTH12A03:89557855:89560094Cotton_A_38016GaXTH31A10:44615479:44616542:Cotton_A_05521GaXTH13A04:129478698:129481523Cotton_A_12376GaXTH32A10:52283499:52284468:Cotton_A_03813GaXTH14A04:51163280:51165160Cotton_A_20823GaXTH33A10:64665692:64667660:Cotton_A_09480GaXTH15A04:54880990:54882163Cotton_A_35786GaXTH34A12:12684178:12685310:Cotton_A_31303GaXTH16A04:60705765:60707070Cotton_A_25413GaXTH35A12:34051265:34052962:Cotton_A_35002GaXTH17A04:89798573:89799636Cotton_A_19764GaXTH36A13:62914914:62916910:Cotton_A_25279GaXTH18A05:58793256:58794782Cotton_A_21850GaXTH37A13:84440430:84442110:Cotton_A_08939GaXTH19A05:9581192:9583392表2雷蒙德氏棉XTH基因家族信息Tab.2InformationofXTHgenefamilyinG.raimondii基因ID基因名字染色体定位基因ID基因名字染色体定位GeneIDGenenameGenelocalizationGeneIDGenenameGenelocalizationGorai.002G150800.1GrXTH01D02:29594142:29595429Gorai.007G068800.1GrXTH21D07:4863813:4865550Gorai.002G161700.1GrXTH02D02:37149049:37151476Gorai.007G228100.1GrXTH22D07:27699621:27702142Gorai.002G213300.1GrXTH03D02:56168118:56169741Gorai.007G373000.1GrXTH23D07:60541095:60544290Gorai.003G033600.1GrXTH04D03:3275335:3276940Gorai.008G086800.1GrXTH24D08:19402168:19403979Gorai.003G052400.1GrXTH05D03:8010982:8012561Gorai.008G094900.1GrXTH25D08:25681866:25683344Gorai.003G145700.1GrXTH06D03:41222810:41224717Gorai.008G223600.1GrXTH26D08:51008258:51010026Gorai.004G030500.1GrXTH07D04:2411566:2413113Gorai.009G006300.1GrXTH27D09:539944:541212Gorai.004G030600.1GrXTH08D04:2420943:2422333Gorai.009G006400.1GrXTH28D09:544081:545474Gorai.004G030700.1GrXTH09D04:2438337:2439546Gorai.009G079800.1GrXTH29D09:5748075:5749293Gorai.004G031100.1GrXTH10D04:2514023:2515410Gorai.009G110900.1GrXTH30D09:8101807:8104125Gorai.004G100900.1GrXTH11D04:18103133:18104063Gorai.009G158400.1GrXTH31D09:12149255:12150542Gorai.004G182100.1GrXTH12D04:49354478:49357089Gorai.009G337400.1GrXTH32D09:36979326:36980890Gorai.004G226400.1GrXTH13D04:56094379:56096895Gorai.009G414100.1GrXTH33D09:63314016:63316042Gorai.004G231400.1GrXTH14D04:56848270:56851578Gorai.010G074000.1GrXTH34D10:10551194:10552750Gorai.005G025000.1GrXTH15D05:2223182:2224914Gorai.010G177300.1GrXTH35D10:51930366:51932004Gorai.005G113400.1GrXTH16D05:21595641:21596958Gorai.011G016500.1GrXTH36D11:1158575:1160903Gorai.005G153200.1GrXTH17D05:43000414:43003167Gorai.011G034600.1GrXTH37D11:2566620:2568656Gorai.005G208300.1GrXTH18D05:58867176:58869852Gorai.013G032000.1GrXTH38D13:2432978:2435820Gorai.006G162400.1GrXTH19D06:42187950:42189945Gorai.013G072200.1GrXTH39D13:8624819:8627170Gorai.007G057400.1GrXTH20D07:4088540:4090085-4- 中国科技论文在线http://www.paper.edu.cn125表3陆地棉XTH基因家族信息Tab.3InformationofXTHgenefamilyinG.hirsutum基因ID基因名字染色体定位基因ID基因名字染色体定位GeneIDGenenameGenelocalizationGeneIDGenenameGenelocalizationGh_A01G1518GhXTH01At01:91043247:91047930Gh_D03G0294GhXTH37Dt03:3278672:3279782Gh_A02G1426GhXTH02At02:80044015:80045125Gh_D03G1327GhXTH38Dt03:41659957:41661533Gh_A02G0866GhXTH03At02:25210658:25211584Gh_D03G0483GhXTH39Dt03:8068958:8070261Gh_A02G1346GhXTH04At02:77903568:77903852Gh_D04G1060GhXTH40Dt04:34633808:34635308Gh_A02G1347GhXTH05At02:77904166:77904671Gh_D05G1444GhXTH41Dt05:12891658:12892642Gh_A03G0243GhXTH06At03:3766479:3768057Gh_D05G0764GhXTH42Dt05:6285485:6286628Gh_A03G1432GhXTH07At03:94111930:94114028Gh_D05G1009GhXTH43Dt05:8536189:8537828Gh_A03G0986GhXTH08At03:63892307:63894149Gh_D05G3030GhXTH44Dt05:39727597:39728660Gh_A04G0599GhXTH09At04:40860911:40862605Gh_D06G1602GhXTH45Dt06:53896382:53897506Gh_A05G1275GhXTH10At05:12967352:12968345Gh_D08G0272GhXTH46Dt08:2673286:2674299Gh_A05G0925GhXTH11At05:9182853:9184482Gh_D08G2130GhXTH47Dt08:60673211:60676126Gh_A05G2724GhXTH12At05:49203457:49204520Gh_D08G0913GhXTH48Dt08:18732962:18733950Gh_A06G1277GhXTH13At06:92317707:92318839Gh_D08G1682GhXTH49Dt08:52612428:52614658Gh_A06G0558GhXTH14At06:14372332:14373888Gh_D08G2086GhXTH50Dt08:59716413:59736876Gh_A08G1387GhXTH15At08:88616913:88619167Gh_D09G1367GhXTH51Dt09:41025814:41027200Gh_A08G1736GhXTH16At08:97360407:97362523Gh_D10G0149GhXTH52Dt10:1196982:1198944Gh_A08G0195GhXTH17At08:2040072:2041080Gh_D10G0299GhXTH53Dt10:2554497:2556268Gh_A08G1784GhXTH18At08:98106296:98109205Gh_D11G0639GhXTH54Dt11:5582090:5583296Gh_A09G1365GhXTH19At09:66564053:66565438Gh_D11G0896GhXTH55Dt11:7748672:7749420Gh_A10G0146GhXTH20At10:1225200:1227093Gh_D11G1431GhXTH56Dt11:14154592:14163157Gh_A10G0297GhXTH21At10:2701403:2703167Gh_D11G3271GhXTH57Dt11:65687753:65690563Gh_A11G0455GhXTH22At11:4371589:4372710Gh_D11G2065GhXTH58Dt11:28695101:28696407Gh_A11G0768GhXTH23At11:7585700:7586454Gh_D12G0806GhXTH59Dt12:24883766:24885026Gh_A11G0556GhXTH24At11:5258751:5259950Gh_D12G0752GhXTH60Dt12:19087203:19088941Gh_A11G1910GhXTH25At11:51161945:51163249Gh_D12G2048GhXTH61Dt12:53437649:53439006Gh_A11G2885GhXTH26At11:92805273:92808122Gh_D13G0290GhXTH62Dt13:2834365:2836366Gh_A12G1873GhXTH27At12:81299427:81300811Gh_D13G0639GhXTH63Dt13:9017009:9018691Gh_A13G0500GhXTH28At13:10953978:10955752Gh_Sca010556G01GhXTH64scaffold10556:2653:3774Gh_A13G0271GhXTH29At13:3342042:3344043Gh_A05G3899GhXTH65scaffold1237_At05:111616:111936Gh_D01G1277GhXTH30Dt01:33973895:33976322Gh_A05G3992GhXTH66scaffold1247_At05:28909:29972Gh_D01G1765GhXTH31Dt01:54606017:54607164Gh_A05G3993GhXTH67scaffold1247_At05:32980:34030Gh_D01G1272GhXTH32Dt01:33402288:33403729Gh_A02G1729GhXTH68scaffold196_At02:18213:19722Gh_D02G0992GhXTH33Dt02:23767812:23768939Gh_Sca241384G01GhXTH69scaffold241384:2:214Gh_D02G0220GhXTH34Dt02:2631191:2632576Gh_D05G3929GhXTH70scaffold4083_Dt05:891:1955Gh_D02G1371GhXTH35Dt02:46149946:46151842Gh_D05G3930GhXTH71scaffold4083_Dt05:4894:9915Gh_D02G1891GhXTH36Dt02:62467427:62469530Gh_D11G3437GhXTH72scaffold4530_Dt11:725075:7261382.2基因进化和基因结构分析利用软件Bioedit构建亚洲棉、雷蒙德氏棉和陆地棉XTH基因家族的进化树,并依据进化树中XTH基因的输出顺序,绘制基因结构图。从图1中可以看出,依据亚洲棉、雷蒙德130氏棉和陆地棉构建的进化树大体将XTH基因分为2组,每组基因包含的棉属XTH基因的结构相似且进化树之间的拓扑结构也相似,表明根据进化树与基因结构做出的分类具有很高的-5- 中国科技论文在线http://www.paper.edu.cn相似性。两组XTH基因在基因结构上具有鲜明的特征,在148个棉花XTH中,Ⅰ组含有66个XTH基因,除GhXTH69含有1个,GhXTH23、GhXTH50和GhXTH53含有2个,GaXTH03和GhXTH06含有5个外显子外,其它56个XTH基因都包含3个外显子;Ⅱ组中包含82个135XTH基因,除GhXTH04、GaXTH09和GhXTH65含有1个,GhXTH05、GrXTH15和GaXTH24含有2个,GhXTH56含有8个,GhXTH01含有9个外显子外,其他74个XTHs含有3-4个外显子。140-6- 中国科技论文在线http://www.paper.edu.cnⅠⅡ图1亚洲棉,雷蒙德氏棉和陆地棉XTH基因家族的进化树和基因结构Fig.1PhylogenictreeandgenestructureoftheXTHgenefamilyinG.arboreum,G.raimondiiandG.hirsutum-7- 中国科技论文在线http://www.paper.edu.cn2.3基因定位与共线性分析145根据XTH基因序列的比对结果,将同源性大于80%的两个序列看作是同源基因,具有共线性。利用circos作图软件,根据基因的位置信息,将同源基因用线条连接起来。GhXTH64~GhXTH72位于Scaffold上,本研究未对其进行分析。除GaA11、GrD01、GrD12、GhAt07和GhDt07没有XTH基因外,其他染色体上均有XTH基因家族成员分布,其中GaXTH03-GaXTH04、GaXTH06-GaXTH07-GaXTH08、GaXTH10-GaXTH11-GaXTH12、150GaXTH24-GaXTH25、GhXTH04-GhXTH05、GhXTH22-GhXTH24、GhXTH30-GhXTH32、GhXTH42-GhXTH43、GrXTH07-GrXTH08-GrXTH09-GrXTH10、GrXTH13-GrXTH14、GrXTH27-GrXTH28分别串联分布在染色体上,表明棉花XTH基因在染色体上并不是随机分布的(图2)。从图2可以看出,XTH基因序列相似性较高,棉种内和棉种间都存在同源基因,例如155亚洲棉种内的GaXTH05-GaXTH07、GaXTH06-GaXTH07、GaXTH11-GaXTH12,雷蒙德氏棉种内的GrXTH05-GrXTH28、GrXTH07-GrXTH08、GrXTH17-GrXTH38,陆地棉种内的GhXTH24-GhXTH54、GhXTH23-GhXTH55、GhXTH29-GhXTH62等,亚洲棉和雷蒙德氏棉种间的GaXTH01-GrXTH05、GaXTH07-GrXTH08、GaXTH11-GrXTH13等,亚洲棉和陆地棉种间的GaXTH01-GhXTH08、GaXTH25-GhXTH12、GaXTH26-GhXTH14,雷蒙德氏棉和陆地棉160种间的GrXTH26-GhXTH61、GrXTH21-GhXTH54、GrXTH13-GhXTH50。此外,几乎每条陆地棉XTH序列都能对应到雷蒙德氏棉和亚洲棉上,这与人们公认的雷蒙德氏棉和亚洲棉是四倍体棉花的祖先相一致。-8- 中国科技论文在线http://www.paper.edu.cn165图2亚洲棉、雷蒙德氏棉和陆地棉XTH基因家族成员同源关系Fig.2ThehomologyofXTHgenefamilymembersfromG.arboreum,G.raimondiiandG.hirsutum2.5蛋白保守基序和结构域分析将148条XTH氨基酸序列进行同源比对,共得到6个保守基序(图3),部分保守性氨基酸残基组成XTH家族特有的保守性基序。其中,DEIDFEFLG是XTH家族的特征基序,170保守性较好但在不同成员间又存在差异,这些差异可能导致了基因功能的分化。-9- 中国科技论文在线http://www.paper.edu.cn175180185图3亚洲棉、雷蒙德氏棉和陆地棉148个XTH家族成员氨基酸序列保守性分析Fig.3Conservationanalysisofaminoacidsof148XTHsinG.arboreum,G.raimondiiandG.hirsutum2.6系统发育分析利用37个亚洲棉、39个雷蒙德氏棉、72个陆地棉和33个拟南芥的XTH氨基酸序列构建系统进化树(图4)。结果显示,陆地棉和拟南芥氨基酸序列没有因为物种的差异而单独190分为两类,说明陆地棉和拟南芥的XTH成员具有较近的亲缘关系。根据进化树,可将所有XTH基因分为2组,即XTHⅠ、XTHⅡ。XTHⅠ包含14个亚洲棉基因、12个雷蒙德氏棉基因、28个陆地棉基因和11个拟南芥基因;XTHⅡ包含23个亚洲棉基因、27个雷蒙德氏棉基因、44个陆地棉基因和22个拟南芥基因,同时发现进化树中有27对亚洲棉与陆地棉的XTHs、25对雷蒙德氏棉与陆地棉的XTHs位于进化树末端分支,再一次表明雷蒙德氏棉、亚洲棉195都与陆地棉的亲缘关系比较近。-10- 中国科技论文在线http://www.paper.edu.cnⅠⅡ图4亚洲棉、雷蒙德氏棉、陆地棉和拟南芥XTH家族的进化树Fig.4PhylogenictreeoftheXTHfamilyinG.arboreum,G.raimondii,G.hirsutumandArabidopsisthaliana2.7陆地棉XTH基因家族的理化性质和亚细胞定位分析200氨基酸序列理化性质分析表明:亚洲棉中XTH蛋白分子量最小仅为23.1kDa,最大可达41.6kDa,理论等电点介于4.8-9.71。雷蒙德氏棉中XTH蛋白分子量最小为24.78kDa,最大可达66.28kDa,理论等电点从4.59至9.5。陆地棉XTH基因家族成员蛋白分子量介于10.6~44.2kDa,理论等电点大多介于4.43~9.76。亚细胞定位预测发现,不管在亚洲棉、雷蒙德氏棉还是陆地棉中,大多数XTH基因定205位在细胞壁上。-11- 中国科技论文在线http://www.paper.edu.cn表4亚洲棉XTHs理化性质及亚细胞定位210Tab.4PhysicochemicalpropertiesandsubcellularlocationofXTHproteinsinG.arboreum基因名字蛋白长度分子量等电点亚细胞定位基因名字蛋白长度分子量等电点亚细胞定位GenenameLength(aa)MW(kDa)PISubcellularlocalizatioGenenameLength(aa)MW(kDa)PISubcellularlocalizatioGaXTH0133037.87.17CellwallGaXTH2034840.08.60CellwallGaXTH0229534.58.80CellwallGaXTH2128933.36.31CellwallGaXTH0336942.58.89CellwallGaXTH2231034.98.62CellwallGaXTH0429033.36.38CellwallGaXTH2329333.07.67CellwallGaXTH0528031.75.76Cellwall.CytoplasmGaXTH2430735.05.60Cellwall.CytoplasmGaXTH0626630.16.16Cellwall.CytoplasmGaXTH2529032.66.82Cellwall.CytoplasmGaXTH0728031.67.58Cellwall.CytoplasmGaXTH2629133.28.59CellwallGaXTH0828031.86.82Cellwall.CytoplasmGaXTH2729232.86.70CellwallGaXTH0911913.68.91ExtracellGaXTH2820423.99.10CellwallGaXTH1029433.35.66CellwallGaXTH2929433.79.71CellwallGaXTH1129133.55.98ExtracellGaXTH3026230.46.71ExtracellGaXTH1229133.55.98ExtracellGaXTH3129232.95.64Cellwall.CytoplasmGaXTH1329433.99.19CellwallGaXTH3225829.39.38ExtracellGaXTH1423126.16.44ExtracellGaXTH3330034.85.45CellwallGaXTH1529434.38.80Cellwall.CytoplasmGaXTH3429434.44.72CellwallGaXTH1628933.05.97CellwallGaXTH3529333.69.69CellwallGaXTH1729733.68.46Cellwall.CytoplasmGaXTH3633638.36.92CellwallGaXTH1829133.09.23Cellwall.CytoplasmGaXTH3729433.55.41CellwallGaXTH1933137.65.49Cellwall表5陆地棉XTHs理化性质及亚细胞定位Tab.5PhysicochemicalpropertiesandsubcellularlocationofXTHproteinsinG.raimondii基因名字蛋白长度分子量等电点亚细胞定位基因名字蛋白长度分子量等电点亚细胞定位GenenameLength(aa)MW(kDa)PISubcellularlocalizatioGenenameLength(aa)MW(kDa)PISubcellularlocalizatioGrXTH0129733.58.16Cellwall.CytoplasmGrXTH2130335.28.60Cellwall.CytoplasmGrXTH0230335.38.92CellwallGrXTH2228933.15.79CellwallGrXTH0329534.48.65CellwallGrXTH2329433.89.19CellwallGrXTH0429033.36.38CellwallGrXTH2428933.26.30CellwallGrXTH0531335.26.30Cellwall.CytoplasmGrXTH2529834.98.88Cellwall.CytoplasmGrXTH0630734.57.03CellwallGrXTH2634840.28.96CellwallGrXTH0728031.75.30Cellwall.CytoplasmGrXTH2729033.05.28Cellwall.CytoplasmGrXTH0828131.86.16Cellwall.CytoplasmGrXTH2829032.66.82Cellwall.CytoplasmGrXTH0931235.58.45CellwallGrXTH2929033.36.65ExtracellGrXTH1028031.86.31Cellwall.CytoplasmGrXTH3030133.97.03CellwallGrXTH1123727.18.43ExtracellGrXTH3126630.19.47ExtracellGrXTH1235140.48.39CellwallGrXTH3229232.95.43Cellwall.CytoplasmGrXTH1330134.76.38ExtracellGrXTH3329333.79.66CellwallGrXTH1436741.66.85CellwallGrXTH3428432.78.28ExtracellGrXTH1519923.19.17Cellwall.CytoplasmGrXTH3529434.44.80CellwallGrXTH1629032.77.59Cellwall.CytoplasmGrXTH3630034.95.59CellwallGrXTH1733037.87.17CellwallGrXTH3727732.08.85CellwallGrXTH1829433.65.49CellwallGrXTH3833738.56.92CellwallGrXTH1929433.89.71CellwallGrXTH3932436.95.81CellwallGrXTH2031836.56.39Cellwall-12- 中国科技论文在线http://www.paper.edu.cn表6陆地棉XTHs理化性质及亚细胞定位215Tab.6PhysicochemicalpropertiesandsubcellularlocationofXTHproteinsinG.hirsutum基因名字蛋白长度分子量等电点亚细胞定位基因名字蛋白长度分子量等电点亚细胞定位GenenameLength(aa)MW(kDa)PISubcellularlocalizatioGenenameLength(aa)MW(kDa)PISubcellularlocalizatioGhXTH0139744.24.98Cellwall.GhXTH3729033.26.17Cellwall.GhXTH0229033.36.17Cellwall.GhXTH3830033.78.18Cellwall.GhXTH0324627.57.68Cellwall.Cytoplasm.GhXTH3931335.16.30Cellwall.Cytoplasm.GhXTH049410.69.18Cellwall.GhXTH4029333.79.66Cellwall.GhXTH0513515.04.64Cellwall.Cytoplasm.GhXTH4126630.19.47Extracell.GhXTH0624327.46.64Cellwall.GhXTH4224027.48.55Extracell.GhXTH0729433.75.49Cellwall.GhXTH4330133.97.03Cellwall.GhXTH0833037.87.17Cellwall.GhXTH4429232.95.43Cellwall.Cytoplasm.GhXTH0929333.79.64Cellwall.GhXTH4529434.44.79Cellwall.GhXTH1026630.19.47Cellwall.GhXTH4628031.86.31Cellwall.Cytoplasm.GhXTH1130134.17.07Cellwall.GhXTH4736741.77.18Cellwall.GhXTH1229232.95.93Cellwall.Cytoplasm.GhXTH4826229.86.95Cellwall.GhXTH1329434.44.72Cellwall.GhXTH4935140.48.39Cellwall.GhXTH1428432.58.59Cellwall.GhXTH5014416.97.62Extracell.GhXTH1535040.38.44Cellwall.GhXTH5129433.89.71Cellwall.GhXTH1630134.56.38Cellwall.GhXTH5230034.85.45Cellwall.GhXTH1728031.87.61Cellwall.Cytoplasm.GhXTH5327732.08.85Cellwall.GhXTH1836741.76.62Cellwall.GhXTH5430335.28.40Cellwall.Cytoplasm.GhXTH1929433.89.76Cellwall.GhXTH5521323.94.83Cellmembrane.Extracell.GhXTH2028433.15.12Cellwall.GhXTH5679989.56.19Endoplasmicreticulum.Extracell.GhXTH2127732.19.01Cellwall.GhXTH5727832.29.23Cellwall.GhXTH2231836.56.39Cellwall.GhXTH5828933.15.97Cellwall.GhXTH2321323.94.83Cellwall.GhXTH5932237.88.58Cellwall.Cytoplasm.GhXTH2430335.38.75Cellwall.Cytoplasm.GhXTH6028933.26.24Cellwall.GhXTH2528933.05.97Cellwall.GhXTH6134840.28.96Cellwall.GhXTH2629533.99.19Cellwall.GhXTH6233738.56.92Cellwall.GhXTH2734840.08.59Cellwall.GhXTH6329433.55.39Cellwall.GhXTH2832437.05.75Cellwall.GhXTH6428933.16.59Cellwall.GhXTH2933638.26.86Cellwall.GhXTH6510612.59.42Extracell.GhXTH3030335.48.78Cellwall.GhXTH6629032.66.30Cellwall.Cytoplasm.GhXTH3129534.58.80Cellwall.GhXTH6729033.05.42Cellwall.CytoplasmGhXTH3226129.98.53Cellwall.GhXTH6829133.09.30Cellwall.CytoplasmGhXTH3328732.66.31Cellwall.Cytoplasm.GhXTH69708.44.43Cellwall.GhXTH3429133.09.15Cellwall.Cytoplasm.GhXTH7029032.66.82Cellwall.CytoplasmGhXTH3533037.87.17Cellwall.GhXTH7124728.26.42Extracell.GhXTH3629433.65.49Cellwall.GhXTH7229733.67.57Cellwall.Cytoplasm2.4陆地棉XTHs上游顺式作用元件分析采用PLACE启动子预测软件,对XTHs的启动子序列进行分析,结果表明在翻译起始密码子ATG上游存在着多个转录起始的核心启动子元件TATA-box、启动子和增强子区常见顺式作用元件CAAT-box。此外,还含有丰富的与胚乳发育、光信号途径、参与生理节奏、220热压力及激素信号途径发育等有关的顺式作用元件。例如:65个XTH基因启动子序列中包含胚乳表达需要的顺式作用元件Skn-1_motif;61个XTH基因上游序列中包含响应光的顺式作用元件Box4;至少有55条序列包含与生理节奏相关的顺式作用元件激素circadian;53条序列包含与热压力相关的顺式作用元件HSE;52、44、43、43条XTH序列分别包含光影-13- 中国科技论文在线http://www.paper.edu.cn响要素BoxI、G-Box、GT1-motif、Sp1;51条序列包含与防御相关的顺式作用元件TC-rich225repeats;44条序列包含MYB结合位点MBS;51条XTH基因上游序列中包含与水杨酸反应相关的顺式作用元件TCA-element;38条序列包含乙烯响应元素ERE;31条序列包含茉莉酸甲酯相关的顺式作用元件TGACG-motif;31条XTH序列包含确保高转录水平的顺式作用元件5UTRPy-richstretch;赤霉素响应要素GARE-motif、TATC-box和P-box分别存在于30、13和21条序列中。230其中P-box、GARE-motif、TGACG-motif、ABRE、ERE和TGA-element是专门调控GA、JA、ABA、ethylene和auxin的。在棉花发育过程中,这类激素能调控棉纤维的生长,在纤维发育过程中优先表达的基因,至少含有三种以上的激素响应元件[19],而XTH基因家族中部分基因包含大量的这类激素调控元件,证明部分XTH基因参与棉纤维的生长,在棉纤维生长过程中发挥重要作用。235表7陆地棉XTH顺式作用元件统计信息Tab.7Statisticalinformationofcis-actingelementofXTHgenefamilyinG.hirsutum顺式作用元件数目顺式作用元件数目CAAT-box70Sp143TATA-box68GT1-motif43Skn-1_motif65I-box42Box461TCA-element40circadian55ERE38HSE535UTRPy-richstretch31BoxI52TGACG-motif31TC-richrepeats51GARE-motif30ARE46ATCT-motif30MBS44ABRE27G-Box44P-box213讨论XTH基因家族成员广泛存在于植物中。目前,拟南芥的XTH基因家族在全基因组水平上得到了鉴定,而棉属中雷蒙德氏棉(D基因组)、亚洲棉(A基因组)和陆地棉(AADD)240全基因组测序的完成使得我们能够在全基因组水平上对这两个棉种XTH基因家族鉴定及比较分析。本研究从亚洲棉、雷蒙德氏棉和陆地棉中分别鉴定出37、39和72个XTH基因。基于蛋白的亚细胞定位分析,XTH蛋白大多数定位在细胞外,可能存在于细胞壁中,调控木葡聚糖的水解和转移,这与前人研究中证明的XTHs的功能相符合[20]。本研究结果显示绝大多数棉花XTHs含有3-4个外显子,少数基因含有1-2、5、8、9245个外显子,基因结构的复杂性与系统进化树的分类一致。结合33个拟南芥XTH家族成员构建棉花与拟南芥的混合系统进化树,进化树中聚类关系越近,说明其具有相似功能的可能性越大,因此我们可以根据拟南芥中功能研究比较深入的基因推测陆地棉中与之亲缘关系较近的基因的功能。拟南芥AtXTH21主要在根和花中表达[21],在初生根生长方面有着重要作用,与纤维素沉积和细胞壁延伸有关,因此我们推测与AtXTH21位于同一分支的XTH基因也参-14- 中国科技论文在线http://www.paper.edu.cn250与细胞壁纤维素的沉积和细胞壁延伸。此外,AtXTH参与细胞壁的重构和修饰[22],AtXTH24、AtXTH30等在根和茎的伸长中高效表达影响着植物的生长发育[23]。同时,苹果和番茄中的部分XTH能够响应一些外部刺激,如黑暗、缺氧、高盐浓度等,在响应抗逆胁迫反应中发挥着重要作用[24]。表明XTH基因家族是一个功能多样性的大家族,棉花XTH基因家族的全基因组鉴定为进一步研究基因的功能奠定了基础。2554结论本文给出了亚洲棉、雷蒙德氏棉和陆地棉基因组中分别包含37、39、72个XTH基因家族成员,明确了三个棉种XTH基因家族的基因结构特点、保守基序、理化性质以及蛋白的亚细胞定位,分析了陆地棉XTH启动子序列特点,为研究XTH基因家族的功能提供了参考。260[参考文献](References)[1]VissenbergK,Martinez-VilchezIM,VerbelenJP,etal.InvivocolocalizationofxyloglucanendotransglycosylaseactivityanditsdonorsubstrateintheelongationzoneofArabidopsisroots[J].ThePlantCell,2000,12(7):1229-1238.[2]McdougallGJ,FrySC.Xyloglucanoligosaccharidespromotegrowthandactivatecellulase:evidencefora265roleofcellulaseincellexpansion[J].PlantPhysiology,1990,93(3):1042-1048.[3]解敏敏,晁江涛,孔英珍.参与木葡聚糖合成的糖基转移酶基因研究进展[J].植物学报,2015,50(5):644-651.[4]YokoyamaR,NishitaniK.Acomprehensiveexpressionanalysisofallmembersofagenefamilyencodingcell-wallenzymesallowedustopredictcis-regulatoryregionsinvolvedincell-wallconstructioninspecificorgans270ofArabidopsis[J].Plant&CellPhysiology,2001,42(10):1025.[5]MarisA,KaewthaiN,EklöfJM,etal.Differencesinenzymicpropertiesoffiverecombinantxyloglucanendotransglucosylase/hydrolase(XTH)proteinsofArabidopsisthaliana[J].JournalofExperimentalBotany,2011,62(1):261.[6]AtkinsonRG,JohnstonSL,YaukYK,etal.Analysisofxyloglucanendotransglucosylase/hydrolase(XTH)275genefamiliesinkiwifruitandapple[J].PostharvestBiology&Technology,2009,51(2):149-157.[7]杜丽萍,沈昕,陈少良,等.细胞壁重构关键酶木葡聚糖内转糖苷酶/水解酶(XTH)的研究进展[J].农业生物技术学报,2010,18(3):604-609.[8]RoseJKC,BraamJ,FrySC,etal.TheXTHfamilyofenzymesinvolvedinxyloglucanendotransglucosylationandendohydrolysis:currentperspectivesandanewunifyingnomenclature[J].Plant&Cell280Physiology,2002,43(12):1421-1435.[9]LiF,FanG,WangK,etal.GenomesequenceofthecultivatedcottonGossypiumarboreum[J].NatureGenetics,2014,46(6):567.[10]WangK,WangZ,LiF,etal.ThedraftgenomeofadiploidcottonGossypiumraimondii[J].NatureGenetics,2012,44(10):1098-103.285[11]LiF,FanG,LuC,etal.Genomesequenceofcultivateduplandcotton(GossypiumhirsutumTM-1)providesinsightsintogenomeevolution[J].NatureBiotechnology,2015,33(5):524.[12]ZhangT,HuY,JiangW,etal.Sequencingofallotetraploidcotton(GossypiumhirsutumL.acc.TM-1)providesaresourceforfiberimprovement.[J].NatureBiotechnology,2015,33(5):531.[13]FinnRD,ClementsJ,EddySR.HMMERwebserver:interactivesequencesimilaritysearching[J].Nucleic290AcidsResearch,2011,39(8):29-37.[14]刘国元,吴嫚,于霁雯,等.雷蒙德氏棉Argonaute基因家族的生物信息学预测与分析[J].棉花学报,2014,(5):411-419.[15]TamuraK,StecherG,PetersonD,etal.MEGA6:molecularevolutionarygeneticsanalysisversion6.0[J].MolecularBiologyandEvolution,2013,30(12):2725-2729.295[16]沈知临,许磊,陈文,等.亚洲棉和雷蒙德氏棉MATE基因家族生物信息学及其同源基因在陆地棉中的表达分析[J].棉花学报,2016,28(3):215-226.[17]LiLB,YuDW,ZhaoFL,etal.Genome-wideanalysisofthecalcium-dependentproteinkinasegenefamilyinGossypiumraimondii[J].JournalofIntegrativeAgriculture,2015,14(1):29-41.[18]郭庆勋,张春雨,王晶莹,等.九台晚李PGIP基因的克隆及生物信息学分析[J].植物遗传资源学报,3002010,11(05):650-653.[19]ChouKC,ShenHB.Anewmethodforpredictingthesubcellularlocalizationofeukaryoticproteinswithbothsingleandmultiplesites:Euk-mPLoc2.0[J].PlosOne,2010,5(4):e9931.[20]TangK,DongCJ,LiuJY.Genome-widecomparativeanalysisofthephospholipaseDgenefamiliesamong-15- 中国科技论文在线http://www.paper.edu.cnallotetraploidcottonanditsdiploidprogenitors[J].PloSOne,2016,11(5):e0156281.305[21]ZhuXF,ShiYZ,LeiGJ,etal.XTH31,encodinganinvitroXEH/XET-activeenzyme,regulatesaluminumsensitivitybymodulatinginvivoXETaction,cellwallxyloglucancontent,andaluminumbindingcapacityinArabidopsis[J].ThePlantCell,2012,24(11):4731-47.[22]BecnelJ,NatarajanM,KippA,etal.DevelopmentalexpressionpatternsofarabidopsisXTHgenesreportedbytransgenesandgenevestigator[J].PlantMolecularBiology,2006,61(3):451-467.310[23]Mu09oz-BertomeuJ,MiedesE,LorencesEP.Expressionofxyloglucanendotransglucosylase/hydrolase(XTH)genesandXETactivityinethylenetreatedappleandtomatofruits[J].JournalofPlantPhysiology,2013,170(13):1194-1201.[24]JensM,Eklöf,BrumerH.TheXTHgenefamily:anupdateonenzymestructure,function,andphylogenyinsxyloglucanremodeling[J].PlantPhysiology,2010,153(2):456-66.315-16-'