- 57.00 KB
- 4页
- 1、本文档共5页,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 文档侵权举报电话:19940600175。
结核分枝杆菌(H37Rv)分泌性蛋白的生物信息学预测方法论文【关键词】结核分枝杆菌BioinformaticspredictionstrategyforMycobacteriumtuberculosis(H37Rv)secretedproteins【Abstract】AIM:ToestablishapredictionstrategyforMycobacteriumtuberculosis(H37Rv)secretedproteinstopavetheeofH37RvbasedonVisualFoxProaticsapproachescanbeusedasanassistanttoolinsecretedproteinresearch.【Keytuberculosis;secretedprotein;signalpeptide;bioinformatics【摘要】目的:建立一种结核分枝杆菌(H37Rv)分泌性蛋白的预测方法,为后续研究提供参考依据.方法:以SignalP和TMHMM两个软件对结核分枝杆菌蛋白组进行扫描,基于VisualFoxPro构建“蛋白质数据分析处理系统”对扫描原始数据进行分析处理以识别分泌性蛋白,再经BLASTp完成相似性比对.结果:预测出了179种分泌性蛋白,其中12种为H37Rv所特有.结论:生物信息学方法可作为一种研究分泌性蛋白的辅助工具,用于指导实验.【关键词】结核分枝杆菌;分泌蛋白;信号肽;生物信息学0引言结核分枝杆菌(Mycobacteriumtuberculosis,MTB)的分泌蛋白不但在豚鼠实验中可以引发迟发性超敏反应,在结核病患者体内也可诱导抗体的产生[1],对结核病的预防和诊断具有重要意义.目前有两种实验生物学方法用于MTB分泌蛋白的研究,一种是通过二维凝胶电泳的方法分离MTB早期培养滤液蛋白(CFP).freel.nih.gov)的核酸数据库Nucleotid中查寻关键词“H37Rvpletegenome”.从搜索结果中查找H37Rv全基因组,并以FASTA格式.从英国基因组研究中心Sangercenter的数据库(ftp://ftp.sanger.ac.uk/pub/tb/sequences/)全蛋白质组信息.1.2分析数据分别向SignalP和TMHMM提交H37Rv蛋白组数据.由于SignalP服务器对单次提交数据量有数量限制,因此将H37Rv蛋白组数据分为8次提交(Rv0001Rv0500,Rv0501Rv1000,……Rv3501Rv3924).另由于Rv2048单数据量过大,超过SignalP服务器对单数据的处理范围,因此将Rv2048C端部分氨基酸残基除去(不影响N端信号肽分析).由于TMHMM服务器对提交数据量没有限制,可一次全部提交.返回数据一次保存.1.3建立数据库根据本课题的实际需求,依据SignalP和TMHMM分析结果的数据特点,使用VFP6.0开发了“蛋白质数据分析处理系统”用来存储和处理SignalP和TMHMM的原始分析结果(图2).
1.4获得分泌性蛋白和膜蛋白通过上述数据分析系统自动完成分泌性蛋白和膜蛋白的识别和查询.1.5BLASTp分析将预测出的所有H37Rv分泌性蛋白通过NCBI的BLASTp服务器与所有已知的蛋白序列进行相似性比对,以获得结核杆菌H37Rv特有的分泌性蛋白.2结果2.1H37Rv基因组和蛋白组信息搜集从美国国家生物技术信息中心.ncbi.nlm.nih.gov的核酸数据库Nucleotid中查寻到编号为NC_000962的记录,其中包含了H37Rv的全部基因组信息共4411529bp,从Sanger的数据库获得蛋白组信息,共3924条蛋白序列数据.2.2H37Rv蛋白组信号肽和跨膜区分析将SignalP和TMHMM的原始分析结果通过“蛋白质数据分析处理系统”自动识别N端具有N区、H区和C区等典型信号肽特征的蛋白质和具有典型跨膜螺旋特征的蛋白质,通过数据库的自动查询功能共发现了179个分泌性蛋白(其中有12个已得到相关文献的证实,表1)和150个膜蛋白.表1H37Rv蛋白组信号肽和跨膜区分析结果(略)2.3BLASTp分析对179条分泌性蛋白经BLASTp分析发现有12条蛋白为H37Rv特有,在其他物种已发表的蛋白质序列中无任何相似区域(表2).表2BLASTp分析结果(略)3讨论在对结核杆菌H37Rv的3924条蛋白质分析过程中SignalP共预测出了573条蛋白质含有信号肽;TMHMM预测出了786条蛋白质含有疏水跨膜螺旋,其中623条蛋白质含有信号肽.SignalP和TMHMM对信号肽预测结果的交集为329条,其中150条含有信号肽外疏水跨膜区被列为膜蛋白,其余179条蛋白不含信号肽外疏水跨膜区因而被列为分泌性蛋白.SignalP和TMHMM的原始分析结果数据量非常大,每条蛋白质包含了“蛋白编号”、“可信度”以及“酶切位点”等11项不同信息,因此H37Rv的分析结果中信息量多达43164条.若要对4万多条信息进行人工比较将是一项费时、费力的工作,且人工比较的准确性也难得到保证.我们开发出基于VisualFoxPro的“蛋白质数据分析处理系统”,不仅能将SignalP和TMHMM的原始分析结果自动导入数据库,而且可对数据库中的各项数据进行比较,实现了将分泌性蛋白和膜蛋白的识别工作完全交给计算机来完成.以前用人工方法可能要花费数周时间的工作,现在利用这套系统仅需数秒钟即可完成,同时排除了人为可能造成的错误.
蛋白质的功能由其特定的空间结构决定,而这种空间结构又由蛋白质的氨基酸顺序决定.如果两个蛋白质的一级序列相似,尤其是活性位点的一级序列相似,便很可能预示着这两种蛋白质具有相似的功能.因此,对未知功能的蛋白质进行序列比对是生物信息学中的一项重要工作.本研究通过对预测出的179种分泌性蛋白进行序列相似性比对(BLASTp)发现其中有12种为结核杆菌所特有且功能未知.可以设想,这12种蛋白质或许对结核杆菌的临床诊断具有一定的潜在应用价值.作为分泌性蛋白,它们也可能是具有保护性作用的抗原,在治疗结核病的疫苗研究中成为新的靶点[14].综上所述,利用该体系可实现对结核杆菌H37Rv分泌性蛋白和膜蛋白的快速预测.我们开发的“蛋白质数据分析处理系统”可以处理所有SignalP和TMHMM的分析结果,因而该系统不仅能用于结核杆菌的分泌性蛋白和膜蛋白的预测,而且还可用于其他原核细胞或真核细胞的分泌性蛋白和膜蛋白的预测.作为尝试性的研究,本课题还存在很多不足之处.例如:该预测体系建立在GSP(Generalsecretorypathtuberculosisculturefiltrateproteinsbytensionalpolyacrylamidegelelectrophoresis,Nterminalaminoacidsequencing,andelectrospraymassspectrometry[J].InfectImmun,1997,65(11):4515-4524.[3]ycobacteriumtuberculosisculturefiltrateandpurificationandcharacterizationofsixnovelproteins[J].InfectImmun,1998,66(8):3492-3500.[4]BraunsteinM,GriffinTJIV,KriakovJI,etal.IdentificationofgenesencodingexportedMycobacteriumtuberculosisproteinsusingaTn5529phoAinvitrotranspositionsystem[J].JBacteriol,2000,182(10):2732-2740.[5]KamathAT,FengCG,MacdonaldM,etal.DifferentialprotectiveefficacyofDNAvaccinesexpressingsecretedproteinsofMycobacteriumtuberculosis[J].InfectImmun,1999,67(4):1702-1707.[6]MorrisS,KelleyC,HomunogenicityofsingleandbinationDNAvaccinesagainsttuberculosis[J].Vaccine,.freeleIM,etal.ImmunogenicityandprotectiveefficacyofDNAvaccinesencodingsecretedandnonsecretedformsofMycobacteriumtuberculosisAg85A[J].TuberLungDis,1999,79(4):251-259.[8]LozesE,HuygenK,ContentJ,etal.ImmunogenicityandefficacyofatuberculosisDNAvaccineencodingtheponentsofthesecretedantigen85plex[J].Vaccine,1997,15(8):830-833.[9]SamanichK,BelisleJ,SonnenbergM,etal.DelineationofhumanantibodyresponsestoculturefiltrateantigensofMycobacterium
tuberculosis[J].JInfectDis,1998,178(5):1534-1538.[10]MancaC,LyashchenkoK,ColangeliR,etal.MTC28,anovel28kilodaltonprolinerichsecretedantigenspecificfortheMycobacteriumtuberculosisplex[J].InfectImmun,1997,65(12):4951-4957.[11]FreerG,FlorioycobacteriumtuberculosisandMycobacteriumbovisBCG[J].ResMicrobiol,1998,149(4):265-275.[12],etal.Molecularcloning,expression,andimmunogenicityofMTB12,anovellooleculartuberculosis[J].InfectImmun,1998,66(9):4208-4214.[13]JohnsonS,BrusascaP,LyashchenkoK,etal.CharacterizationofthesecretedMPT53antigenofMycobacteriumtuberculosis[J].InfectImmun,2001,69(9):5936-5939.[14]师长宏,范雄林,柏银兰,等.结核分枝杆菌Ag85BESAT6融合蛋白在小鼠体内诱导的免疫应答及其保护力[J].第四军医大学学报,2004,25(18):1633-1636.[15]SargentF,StanleyNR,BerksBC,etal.SecindependentproteintranslocationinEscherichiacoli.AdistinctandpivotalrolefortheTatBprotein[J].JBiolChem,1999,274(51):36073-36082.[16]TammLK,AroraA,KleinschmidtJH.Structureandassemblyofbetabarrelmembraneproteins[J].JBiolChem,2001,276(35):32399-32402.