• 2.33 MB
  • 2022-04-22 11:33:21 发布

城市供水管网泄漏定位技术研究

  • 60页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'分类号:TN913.23单位代码:10183研究生学号:2015524032密级:公开吉林大学硕士学位论文专业学位()城市供水管网泄漏定位技术研究ResearchonLeakaeLocationTechnoloofUrbanggyWaterSupplyNetwork作者姓名:吴雷类别:工程硕士领域(方向):电子与通信工程指导教师:李娟副教授培养单位:通信工程学院2018年6月 城市供水管网泄漏定位技术研究ResearchonLeakageLocationTechnologyofUrbanWaterSupplyNetwork作者姓名:吴雷专业名称:电子与通信工程指导教师:李娟副教授学位类别:工程硕士答辩日期:年&〉月日> 未经本论文作者的书面授权,依法收存和保管本论文书面版本、电子版本的任何单位和个人,均不得对本论文的全部或部分内容进行任何形式的复制、修改、发行、出租、改编等有碍作者著作权的。否则商业性使用(但纯学术性使用不在此限),应承担侵权的法律责任。吉林大学硕士学位论文原创性声明本人郑重声明:所呈交学位论文,是本人在指导教师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:曰期^^年{月曰方, 摘要城市供水管网泄漏定位技术研究城市供水管网泄漏与爆管事故是国内外供水行业普遍存在的问题,事故突发性强、危害性大、影响范围广。供水管道的泄漏,一方面造成了水资源的浪费,一方面又影响着居民的生活质量和生活成本。如何控制和降低供水管道的泄漏,减少水资源浪费,保证管道正常运行,具有重要意义。近年来,随着人工智能、大数据等新技术的发展,越来越多的新方法应用到故障检测中。在众多方法中,支持向量机(SupportVectorMachines,SVM)算法展示了优越的性能。SVM能够在获取有限的特征信息基础上,最大限度的发掘其隐含的分类信息,更适用于故障诊断这种实际的工程问题。最小二乘支持向量机算法(LeastSquaresSupportVectorMachines,LSSVM)是标准SVM的一种扩展,具有更快的求解速度和更少的求解参数。如采用粒子群算法(ParticleSwarmOptimization,PSO)对LSSVM参数进行优化,能够产生更优的诊断效果。本文以管网泄漏前后的压力变化值作为研究对象,建立了不同泄漏工况下压力变化与泄漏位置和泄漏量的PSO-LSSVM诊断模型。对模型中学习样本的选取进行了深入的研究,分析了样本类型和数量对模型精度的影响,得出了提高学习样本的密度可以改善模型的预测精度的结论。对于大型复杂供水管网,采集泄漏时的学习样本数据是十分困难的,多点泄漏的数据采集更加难以实现。为了解决这个问题,本文提出一种无需大量增加样本数量,仍具有较好定位效果的改进算法。算法仅需选取一个学习样本,提高样本密度,形成增样样本。将增样样本与学习样本的均方误差共同作为PSO-LSSVM算法的适应度函数,使PSO算法在优化参数时既要考虑学习样本的均方误差又要兼顾增样样本的均方误差,从而提高模型的推广能力。本文还研究了增样样本的选取方法,并对增样样本的类型和数量进行分析。研究表明,增样样本可以在学习样本中任意选取,且只需要选取1个增样样本就能使模型推广能力得到提高。最后,利用EPANETH软件模拟了某城市供水管网,采集了不同泄漏工况下的管网压力数据,分别对低密度学习样本、高密度学习样本和改进后算法进行了仿真实验。结果表明,以低密度学习样本构建的PSO-LSSVM诊断模型(算法1),平均绝对误差达到11.73;提高学习样本密度后构建的模型(算法2),平均绝对误差为0.33;改进算法的平均绝对误差为2.12,比算法1降低了9.61,仅比算法2增加了1.79。结合输出编号规则,在泄漏位置判断中,算法1正确率仅为37.70%,无法满足预测精度要求;算法2为98.36%,改进算法正确率为100%,而改进算法在样本获取数量上,由算法2的150组减少为55组,减少了63%,简化了算法运算,说明了改进算法的优越性。I 关键词:供水管网,泄漏定位,泄漏量,PSO-LSSVM,EPANETHII ABSTRACTResearchonLeakageLocationTechnologyofUrbanWaterSupplyNetworkThepipeleakageandburstofurbanwatersupplynetworkisacommonprobleminthewatersupplyindustrybothathomeandabroad.Theleakageofwatersupplypipelinenotonlycausesthewasteofwaterresources,butalsoaffectsthequalityoflifeandlivingcostofresidents.Howtocontrolandreducetheleakageofwatersupplypipeline,reducethewasteofwaterresourcesandensurethenormaloperationofpipelinesisofgreatsignificance.Inrecentyears,withtherapiddevelopmentofartificialintelligence,largedata,andothernewtechnologies,moreandmorenewmethodsareappliedtofaultdetection.Amongthesemethods,theSupportVectorMachines(SVM)showsitssuperiorperformance.SVMcanmaximizethehiddenclassificationinformationonthebasisofobtaininglimitedfeatureinformation.Itismoresuitableforthepracticalengineeringproblemsoffaultdiagnosis.LeastSquaresSupportVectorMachines(LSSVM)isanextensionofstandardSVM.Ithasfastersolutionspeedandlesssolutionresources).IftheParticleSwarmOptimization(PSO)isusedtooptimizeLSSVMparameters,itcanproducebetterdiagnosisresults.Thispaperstudiesthepressurechangesbeforeandaftertheleakageofpipenetwork.ThePSO-LSSVMdiagnosismodeloftheleakage,leakageposition,andpressurechangeatdifferentconditionsisestablished.Theselectionoflearningsamplesinthemodelisfurtherstudied,andtheinfluenceofsample’stypeandnumberontheaccuracyofmodelisanalyzed.Itisconcludedthatincreasingthelearningsampledensitytoacertainscalecanimprovethediagnosticaccuracyofthemodelcorrespondingly.Forlargeandcomplexwatersupplynetwork,itisverydifficulttocollectlearningsampledatawhenleaking,especiallyforcollectionofmultipointleaks.Inordertosolvethisproblem,thispaperproposesanimprovedalgorithmthatdoesnotrequirealargeincreaseinthenumberofsamplesandstillhasagoodpositioningeffect.Thealgorithmonlyneedstoselectonelearningsample,increasethesampledensityandformtheenhancedsample.Themeansquareerror(MSE)ofenhancedsampleandthelearningsampleareusedasthefitnessfunctionofthePSO-LSSVMalgorithm.ThePSOalgorithmshouldconsiderboththeMSEofthelearningsampleandenhancedsampleintheoptimizationoftheparameters,soastoimprovethegeneralizationabilityofthemodel.Thispaperstudiestheselectionmethodofenhancedsample,andanalyzesthetypeandquantityofenhancedsample.Theresearchshowsthattheenhancedsamplecanbeselectedarbitrarilyinlearningsamplesanditonlyneedstoselectoneenhancedsampletoimprovethegeneralizationabilityofthemodel.III Finally,alargecomplexwatersupplynetworkinacityissimulatedbyEPANETHsoftware,andthepressuredataunderdifferentleakageconditionsarecollected.Simulationexperimentsonlowdensitylearningsamples,high-densitylearningsamplesandimprovedalgorithmarecarriedout.ThesimulationresultsshowthatthePSO-LSSVMdiagnosticmodelconstructedbylow-densitylearningsamples(algorithm1)hasanaverageabsoluteerrorof11.73;themodelconstructedbyincreasinglearningsampledensity(algorithm2)hasanaverageabsoluteerrorof0.33.Theaverageabsoluteerroroftheimprovedalgorithmis2.12,whichis9.61lowerthanthatofalgorithm1,whichisonly1.79higherthanthatofalgorithm2.Combinedwiththeoutputnumberrule,theaccuracyrateofalgorithm1isonly37.70%,whichcannotmeetthepredictionaccuracyrequirement.Thealgorithm2is98.36%andtheimprovedalgorithmiscorrectin100%.Theimprovedalgorithmreducesthenumberof150groupsfromalgorithm2to55groups.Itsimplifiesthealgorithmoperation,andillustratesthesuperiorityoftheimprovedalgorithm.Keywords:Watersupplynetwork,Leakagelocation,Leakage,PSO-LSSVM,EPANETHIV 目录第1章绪论···············································································································11.1研究背景与意义····························································································11.2检漏仪器及方法····························································································21.3检漏技术研究进展及现状···········································································41.4论文研究内容································································································6第2章支持向量机理论基础··················································································72.1支持向量机原理····························································································72.1.1统计学理论基础··················································································72.1.2支持向量机基本理论········································································102.2最小二乘支持向量机原理·········································································132.3核函数与参数选择·····················································································142.4本章小结······································································································15第3章基于PSO-LSSVM的改进算法································································173.1LSSVM参数选择的意义及方法······························································173.2粒子群算法··································································································183.3PSO优化LSSVM算法·············································································203.4改进的PSO优化LSSVM算法································································213.4.1改进算法原理····················································································213.4.2改进算法流程····················································································223.5本章小结······································································································24第4章基于PSO-LSSVM算法在城市供水管网中的应用······························25V 4.1城市供水管网的水力模拟·········································································254.1.1供水管网建立的方法········································································254.1.2本文建立的供水管网········································································274.2数据采集及各样本的确定·········································································284.2.1管网正常压力数据的采集································································284.2.2学习样本的确定················································································284.2.3增样样本的确定················································································304.2.4测试样本的确定················································································314.3PSO-LSSVM算法仿真实验······································································314.3.1算法1仿真实验················································································314.3.2算法2仿真实验················································································334.4改进的PSO-LSSVM算法仿真实验························································354.4.1权重系数的确定················································································354.4.2仿真结果分析····················································································354.4.3增样样本的研究················································································384.5本章小结······································································································42第5章总结与展望·································································································435.1工作总结······································································································435.2工作展望······································································································43参考文献······················································································································45作者简介及在攻读硕士期间取得的科研成果·······················································49致谢··························································································································51VI 第1章绪论第1章绪论1.1研究背景与意义水是生命之源,对我们的生命起着尤为重要的作用,是整个人类赖以生存的最重要的物质资源之一。地球表面有近四分之三被水覆盖,然而淡水资源却极其匮乏,绝大部分的淡水资源被封存在南极和格陵兰深暗的冰层之下。偌大的地球淡水资源却十分有限,目前能被人类使用的更是微乎其微。我国形势则更为严峻,人均水资源占有量仅为世界人均水平的28%,是世界上13个贫水国之一[1,2]。我国城市供水矛盾也十分突出,水利部资料显示,我国规模城市中,严重的缺水城市达一百多个,制约了城市的发展建设。城市供水管网系统是城市建设的重要基础设施,对保证城市发展和改善人民生活水平有着十分重要的作用。随着近年来城市的扩张,供水管网的规划缺乏科学性,加之年久失修,有些城市没有专门的管道系统,多为地下深埋,城市管网的漏损情况逐年恶化,根据国际水协统计数据显示,世界大部分发达国家的供水管道泄漏率一般在8%左右[3-5]。在2017(第二届)供水高峰论坛中的数据显示,我国654个城市平均管网漏损率超过15%,图1.1展示了近年来我国城市供水管网漏损率。可见,供水管网漏损管理控制工作任重道远。图1.1我国近年来城市供水管网漏损率随着环保意识的增强,国家从战略层面出台了相关的政策法规。近几年来,相继出台了《城市供水管网漏损控制及评定标准》、《城市供水定价成本监审办法》等条例法规,指出漏损率与水价成本挂钩,使供水行业对其逐渐重视,2013年,《国务院关于加强城市1 吉林大学硕士学位论文基础设施建设的意见》明确了管网漏损率需要控制在国家标准之内;2014年,《进一步加强城市节水工作的通知》要求漏损率达到12%。到2015年,供水漏损率得到进一步的重视。2015年2月,中央政治局常务委员会会议审议通过《水十条》,并于4月16日发布。国家已经越来越重视了用水治水的管控,并且提出“到2020年供水漏损率控制在10%以内”的目标。然而控制漏损率是一个严峻的课题,一方面要合理规划供水管网建设,另一方面要科学分析漏损原因,从源头上加以遏制。漏损的原因十分复杂[6-8],大部分都与管道材质、接口因素、水锤、温度的变化、腐蚀、施工等有关[9-12],如图1.2所示。80%以上的管道是灰口铸铁管,目前正在逐1管道材质渐被球墨铸铁管取代接口材料不合格,接口形式不当,施工不2接口因素规范加压设备频繁启闭,管道阀门快操作,排3水锤气门的失效4温度变化水温变化产生应力,造成管道的破坏5腐蚀管壁变薄直至洞穿,造成漏水6施工基础和回填、管道埋深、地基下沉图1.2漏损原因分析1.2检漏仪器及方法国外的漏损管控方面多管齐下,不仅在理论上进行研究,在装备技术上也投入了大量精力,取得了较好的成绩。英国对管网泄漏技术研究较早,早在六七十年代就成立了相关的供水协会,制定了相关的法律规定,并对管网检漏有个科学系统的研究,而且研发了第一台检漏设备,虽然设备体积庞大,实用性较差,但对以后设备的开发研制起到了奠基的作用[13]。之后,美国、德国等一些欧美国家也将目光投入到相关检漏设备的研制中[14-17],取得了丰硕的成果,相继成功开发出了利用金属管道声音传播特性的相关检漏仪[18]。其原理是在漏点两端安装传感器,当漏点泄漏时可以提取到泄漏水声,将这些信号通过发射机传输到相应的主机上,经过运算来判断漏点位置,具有一定的抗干扰能力。20世纪九十年代初,欧美等国研制成功了泄露噪音自动记录仪[19-22]。这种新设备是由多台采集数据的记录仪器和精度器组成的。噪声记录仪采集漏水时的声波特征,进行比对和分析,再辅以长时间的监测,就能判断设备附近有没有泄漏情况。该设备在使用上受特2 第1章绪论定时间限制,且判断漏损管道的精度不高。进入二十一世纪,英国首先开发成功了多探头相关仪,该设备能把大泄露普查预定位和精确确定漏点位置的技术集于一体。多探头相关仪主要由硬件和软件组成,硬件包括主机、探头,其中探头内置压缩式加速度传感器、A/D转换器等,可记录漏水声信号,通过漏水声到两个探头的时间差来计算漏点位置。该产品摆脱了供水管网检漏对传统熟练工人的依赖,只需掌握设备使用即可操作。泄漏检测技术发展历经传统人工方法,基于硬件和软件的方法和现如今的大数据物联网技术时代。我国的相关研究相比欧美等发达国家起步较晚,发达国家如美国、德国、日本等都制定了相关的法律规定,用以保护管道设施,维护管网设备。目前,国内外对管网泄漏检测的方法主要有以下几种。(1)音听检漏法音听检漏法[23]是最传统的方法之一,在管道技术刚应用后,人们便通过管道泄漏时发出的特殊声音来判断漏点。后来,随着管网的复杂,传统手段已经满足不了要求,一些先进的听漏设备被研发出来,逐渐应用到管网的检测中。现阶段由于管道复杂,埋深大,听漏设备不仅能在地面上应用,还能在一些管段接头阀门等设备上使用,再配合一些电子设备的辅助,可以实现管网的泄漏定位。(2)区域检漏法区域检漏法[24]需要在管道上安装流量计等外设设备。其方法主要在深夜等用水稀少的特定时间。通过封闭检漏小区的阀门,在安装设备进行测定,经过一段时间检测,所产生的流量,可以认为是这段管网的泄漏量。该方法需要设定漏失水量的阈值,当漏失水量未超过阈值时,则认为管网正常,不需要检漏;如果漏失水量超过阈值,则通过关闭部分阀门等措施,缩小测漏地区,最终确定漏点位置。(3)示踪剂法示踪剂一般为无色无味无毒的液体,具有放射性,研究人员利用其特性将其注入管道中,这些示踪剂便充满整个管道。如果管道有泄漏点,这些示踪剂会漏出,对周围的土壤空气形成一定密度,用示踪剂检漏仪等检测设备可以很容易检测到。凭借放射性散步特点,就可以判断出泄漏位置。这种方法一般使用示踪剂(如碘-131)等液体,不适合对饮用水管道直接使用。(4)压力梯度法[25]液体在管道内运动,随着距离的增加,压力、流速会发生变化,其中压力的变化呈现一定的梯度关系。而管道出现泄漏等突发状况时,压力梯度会出现不规则的变化,由平坦的线性关系变成不规则的曲线。这是因为泄漏点处大量的液体流出,导致上下游流量呈现复杂的变化。如果在管道上安装压力传感器等设备,捕捉到这些信息,可以从压力变化的情况判定泄漏点的位置。这种方法不适用于复杂的管网,因为管网的复杂会使压力变化的不规则,而对较长的单一的管道效果会比较好。(5)负压波法[26]3 吉林大学硕士学位论文负压波是管道系统中特有的一种波。当管段的一个点发生泄漏,从漏点处会有液体的不规则流动,由于流动具有突然性,会导致管网中的液体压力流量等发生突变,从而形成负压状态的波。负压波沿着管段的液体传播,最远可以传播几十公里。在管段上下游安装的传感器等设备检测到负压波后,通过时间差便能计算出泄漏位置。负压波的波速确定一直是个复杂的问题,对不同材质的波速,大量学者通过实验和理论分析都进行过研究,但是实际管网往往是多种材质结构,且支路、接头等其他因素较多,导致波速很难确定。另外,如果泄漏较小,负压波也很难被检测到。(6)泄漏噪声探测法[27]泄漏点产生的噪声有其独特的特征,尤其在管网系统中,这种噪声会形成特殊的声波,同过分析声波的特征信息,可以确定漏点位置。泄漏噪声有一定的频谱,一般为6-80kHz,这个频谱范围几乎被外界噪声涵盖,可通过一定的手段进行处理。一般将传感器的声波信号滤波电路的中心频率选为35kHz左右。此方法需要前期收集整理声波数据库,对泄漏噪声要进行特别的研究,当管道出现类似的噪声,则可以判断为泄漏。此外,供水泄漏检测方法还有互相关法、漏磁检测法、频率响应法[28-29]等,实际应用中,要根据不同地理情况和不同管网结构来选择。1.3检漏技术研究进展及现状在不断丰富和完善检漏方法和仪器设备的同时,各种先进的技术也都开始应用于管网的泄漏检测中,使检漏技术得到了不断的发展。国外的研究取得了丰硕的成果[30-31],早先,Goodwin等[32-34]就发现管网泄漏与管网压力有直接关系,通过降低管网漏损可以通过控制管网的压力来实现。Germanopoulos、Jowitt[35-36]在之前研究的基础上,把压力有关的其他泄漏因素引入模型中。美国康乃尔大学Liggett教授和他的研究小组是国际上最早进行基于压力和流量等分析的供水管网漏损诊断的课题组之一。该小组提出了基于压力和流量的逆分析法[37],逆分析法是一种动态的泄漏检测方法,该方法适用于稳态和瞬态的条件。随后,该小组又提出了瞬态分析与遗传算法[38]和阻尼法[39],并进行了瞬态分析的最优监测研究。Kapelan等人运用ShuffledComplexEvolutionMetropolis(SCEM-UA)这一算法结合EPANET供水系统模型来解决水力模型的校核问题。这种算法不需要假定任何线性模型和常量参数,但缺点是计算量较大。随着人工之智能技术的发展,机器学习的算法也应用到管网检测当中,其中人工神经网络算法和支持向量机算法是很有代表性的。人工神经网络算法需要大数据的支持,主要采集正常管网数据和泄漏时的数据,通过人工神经网络的学习和训练,形成泄漏特征与泄漏状态的映射,当发生泄漏时,如果泄漏特征与学习过的数据相似,就可以判定泄漏位置。在我国,自从唐秀家首次提出了基于人工神经网络算法在管道漏损方面的应用以来[40],国内后续学者逐步开展了相关研究。朱东海等[41]研究了神经网络的分类性能,在室内模拟了某城市供水管网,通过试验研究,得出了神经网络在泄漏检测方面的优越性。4 第1章绪论天津大学肖笛[42]利用神经网络的预测能力,通过监测部分节点的压力变化,预测其他节点的水压变化,通过比对压力变化的大小来确定泄漏位置。兰州理工大学李炜等[43]针对人工神经网络算法受初始权值影响的缺点,将遗传算法与之相结合,建立模糊神经网络。这种结合的方法综合了两种算法的优点,取长补短,在实际应用中效果很好。人工神经网络算法虽然在模式识别中展现出很多优点,但是其固有的缺点仍不可忽视,比如网络在求解中易陷入局部最小值,且理论基础不够完备,而支持向量机算法可以很好的解决这个问题。支持向量机在处理小概率、非线性以及高维特模式识别问题中表现出优秀的性能,故障情况的发生是一个随机的小概率事件,因此用支持向量机作故障诊断的模式识别,是非常有效的方法。J.Mashford和D.DeSilva等[44]研究了支持向量机算法在水流模拟测试系统中的应用,使泄漏位置和泄漏量的准确性都能控制在合理的范围内。Y.Terao等[45]根据声学方法建立了支持向量机模式识别系统,采集所有地点泄漏的声音模式输入到分类器中进行训练,训练完成后,就可以通过声音模式的特征信息来判别泄漏点。MashfordJ[46]通过节点的压力和流量等特征信息建立支持向量机模型,用于预测供水管网的故障位置和程度。其方法的准确率不高,只有57.25%,但在位置判断中,该方法可以把误差控制在500米之内,在实际应用中有一定的指导意义。RashidS[47]通过采集管网泄漏时的负压波,去除噪声和不必要的数据,从这些数据中提取统计特征以构造候选特征集。将高斯混合模型和支持向量机分别应用于这些特征向量和类别的目标标签。然后,将这些分类器用于检测管道中的失效状态,定位准确率达到92.3%,能正确识别泄漏的发生,并能判断泄漏位置和大小。国内学者基于支持向量机在故障诊断中的应用也越来越多,在供水管网泄漏定位上虽然起步较晚,但也取得了丰硕的成果。赵艳燕和刘娜[48]通过分析发射信号的特征信息来获取有效的声波信号,并根据发射信号特征提取的噪音和传输的复杂性特点,利用小波包来建造和重建信号,建立并完善了支持向量机的故障分类诊断模型。朝阳、王威[49]利用管网故障时的水压波动值建立了支持向量机模型,利用少量节点与剩余大量节点存在的隐含关系,将训练好的模型进行故障预测。同时,利用神经网络技术做了同样的预测,经过对比,证明了支持向量机在供水管网故障诊断的优越性。但其研究发现,支持向量机对所选用的学习样本非常敏感,如果选取的样本不够代表性,则很难预测较为准确的结果。李楠楠等[50]通过计算节点水压,建立了基于支持向量机的供水管网故障诊断模型,将供水管网故障前后的水压波动值与泄漏位置和泄漏量建立非线性映射,通过采集不同泄漏状态下的水压变化值形成学习样本,再进行故障诊断,取得了较好的效果。但是在数据采集上由于所需样本较多,只能通过搭建简单管网进行模拟,通用性不强。齐成伟等[51]应用Hammer软件进行管网模型计算,将管网的故障样本信息从水压-时间的时域信号转换为压力幅值-频率的频域信号,建立了基于最小二乘支持向量机的供水管网5 吉林大学硕士学位论文故障诊断模型,在较小泄漏方面取得了很好的效果。在供水管网泄漏检测领域,各种方法都尤其独特的优势,但也有一定的弊端,在具体应用上中应综合考虑。1.4论文研究内容本文主要研究了PSO-LSSVM算法在城市供水管网泄漏定位上的应用。首先总结了管网泄漏定位检测技术的各种方法,提出了智能诊断方法是将来发展趋势,从而引出基于PSO-LSSVM的供水管网诊断方法;其次,阐述了支持向量机算法和粒子群算法,并将二者相结合,讨论了这两种算法所涉及到参数的选择,通过对比实验验证了LSSVM对学习样本数量的依赖。针对大规模样本采集获取困难的实际情况,引出增样样本的理念,即通过提高一个学习样本的密度得到增样样本,由该增样样本和学习样本共同调整粒子群算法的优化参数,使诊断模型在保证精度的同时提高了泛化能力;最后,由EPANETH软件构建的城市供水管网进行泄漏模拟实验,验证了本算法对供水管网诊断的有效性。本论文组织结构安排如下:第一章为绪论,指出了论文的研究背景,介绍了国内外供水管网泄漏检测的主要方法,叙述了先进算法在管网泄漏故障上的应用,从而提出了本文的研究内容。第二章为支持向量机的基础理论。介绍了统计学理论知识,详述了支持向量机的基本理论,并指出了其缺点,从而引出其扩展形式,即最小二乘支持向量机算法,最后对核函数和模型选择进行了叙述。第三章叙述了粒子群算法和支持向量机算法的结合,提出本文的改进算法。首先,详述了粒子群算法中参数的意义,说明了参数选择的方法;其次,给出了两种算法结合的具体过程;最后提出了本文的改进方案,即通过调整PSO优化LSSVM时所选择的适应度函数来提高整个模型的预测精度。第四章为基于PSO-LSSVM在城市供水管网中的应用。介绍了供水模拟软件EPANETH,利用该软件模拟了某大型复杂供水管网;将PSO-LSSVM算法应用到该模拟管网上进行泄漏定位研究,仿真分析了低密度学习样本、高密度学习样本和改进算法的结果,并进行分析对比,验证了本文算法的有效性。第五章为全文总结。总结了本文的主要工作,并对下步工作提出展望。6 第2章基支持向量机理论基础第2章支持向量机理论基础支持向量机算法能够有效平衡模型的复杂性和学习能力,具有良好的泛化能力,因而被广泛应用于各个领域的研究。本章主要介绍了支持向量机的基本原理,并对模型参数选择进行了分析。2.1支持向量机原理支持向量机方法是建立在统计学习理论的VC维(Vapnik-Chervonenkisdimension)理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以期获得最好的推广能力。2.1.1统计学理论基础统计学习理论被认为是目前针对小样本统计估计和预测学习的最优秀理论之一。早在20世纪60年代统计学习理论诞生开始,便逐渐引起学者的注意,后来随着VC维理论和结构风险最小化原则的提出,更加丰富和发展了统计学习理论,使它不但是一种理论分析工具,而且还是一种能构造具有多维预测功能的预测学习算法的手段,使原本抽象的学习理论能够转化为通用的容易理解的实际预测算法。在模式识别中,VC维的直观定义是对一个指示函数集,如果存在h个样本能够被函数集中的函数按所有可能的种形式分开,则称函数集能够把h个样本打散;函数集的VC维就是它能打散的最大样本数目h。若对任意数目的样本都有函数能将他们打散,则函数集合的VC维是无穷大的。有界函数集的VC维可以通过用一定的阈值将它转化成指示函数集来定义。VC维反映了函数集的学习能力,一般而言,VC维越大则学习机器越复杂,学习容量越大。目前尚没有通用的关于任意函数集VC维计算的理论,只对一些特殊的函数集知道nn其VC维。一般的,对于n维空间R中,最多只能有n个点是线性独立的,因此R空间超平面的VC维是n+1。如二维线性分类器,它的VC维是3,如图2.1所示。但是对于非线性机器而言,VC维与独立参数的个数之间并没有明确的对应关系,非但如此,在非线性情况下学习机器的VC维通常是无法计算的,在实际中,可以通过变通的办法巧妙的避开直接求解VC维的问题。7 吉林大学硕士学位论文xxxx2222xxxx1111xxxx2222xxxx1111图2.1二维线性分类器VC维示意图机器学习的目的是找寻一种关系,它根据给定的训练样本,找到其隐含的特征,从而确定其输入与输出之间的依赖关系。在数学问题中,学习问题可以表述为变量y与x之间的关系,它们之间符合某一种联合概率,假设为Fxy(,),机器学习问题的数学模型可表述为,假设有n个独立同分布观测样本(x,y),(x,y),(x,y)····································(2.1)1122nn在函数fxw(,)中,求出最优的函数fxw(,),并对这个函数的依赖关系进行预估,使期望风险Rw()Lyfxw(,(,))dFxy(,)··································(2.2)最小。其中,fxw(,)称为预测函数集;w为函数的广义参数。理论上,fxw(,)可以表示为任何函数集,而函数Lyfxw(,(,))是损失函数,这个损失是fxw(,)对y进行预测而产生的,由于学习问题有它自身的多样性,每一种样式的问题,对应了不同的损失函数。在学习方法的发展更新中,人们尝试了经验风险最小化原则,定义经验风险:n1Remp(w)Ly(i,fx(i,w))····································(2.3)ni1机器学习的最终目的,就是要寻找一些方法,通过各种运算,使经验风险最优,即使Rw()最小化。emp随着学习方法的发展,人们发现经验风险最小化原则在有些特定的情况暴露出很多问题,一味的追求经验风险最小会带来一个突出问题,即导致泛化能力下降,比如在样本数据较少,会出现过学习情况。而要求经验风险和推广能力同时最优,实际上是很难做到的。要使经验风险和置信范围这两项都取得较好值,是比较困难的,研究发现结构风险最小化原则可以很好的解决这个问题。对指示函数集中所有函数(包括使经验风险最小的函数),经验风险Rw()和实际风emp8 第2章基支持向量机理论基础险Rw()之间至少1的概率满足如下的关系:hln2/(nh)1ln(/4)Rw()R(w)·························(2.4)empn其中,n是样本个数;h是VC维;是随机参数,0,1。从上式可以看出,在统计学习中实际风险由经验风险和置信范围构成,置信范围是一个界限,它与真实风险和经验风险的差值有关,置信范围也对机器学习的结构有影响,结构越复杂,相应的置信范围就越大,从而带来的后果便是两者之间差别越来越大。为了寻找使得结构风险达到最小的函数fxw(,),统计学习理论提出了一种新的策略,它将函数集Sfxw(,),w看成具有一定的结构,并由一系列嵌套的函数子集SKkfxw(,),w组成,他们满足S12SSknS函数嵌套子集构成的函数集结构如图2.2所示。S1S2Sn图2.2函数嵌套子集构成的函数集结构为了选择合适的S作为学习函数,可以将式2.4右边划分为两部分,即第一项经验风K险和第二项置信范围。如果给定样本数目n,随着VC维数目h的增加,经验风险逐渐变小,而置信范围逐渐递增,如图2.3所示。风险欠学习过学习风险边界置信风险经验风险h1hhnhSS1Sn图2.3结构风险最小化原理图9 吉林大学硕士学位论文真实风险的上界是经验风险和置信范围之和,随着结构元素序号的增加,经验风险将减小,而置信范围将增加。最小的真实风险上界是在结构的某个适当的元素上取得的。综合考虑经验风险与置信区的变化,可以求得最小的风险边界,它所对应的函数集的中间子集S可以作为具有最佳泛化能力的函数集合。可见,利用结构风险最小化原理的思想,就可以完美解决传统机器学习中的过学习问题,支持向量机通过最大化分类边界以最小化VC维,也即在保证经验风险最小的基础上最小化置信风险,从而达到最小化结构风险的目的,因此支持向量机方法实际上就是结构风险最小化思想的具体实现。2.1.2支持向量机基本理论支持向量机在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,它能够推广应用到手写体数字识别、目标识别、语音识别、人脸检测、文本分类、回归估计和密度估计。支持向量机算法最突出的优点在于强大的推广能力,比起其它的智能学习算法,其具有较强的包容能力,是一种可进行积累学习的学习模型,而且这种积累学习算法是非常方便的。支持向量机在线性可分情况下,其实际是考虑一种平面,这个平面称为超平面,需满足一定的要求,使训练点距这个平面越远越好,即使它两侧的空白区域最大,如图2.4所示。H1HH2间距=2/||w||图2.4数据集的最优分类面示意图样本分别由实心点和空心点组成,要寻找一条满足条件的线H,它能正确的分开两类样本。同时画出两条平行于H的线,要求这两条线不仅要平行于H,而且要把实心点和空心点完美的分开,这个分类线方程为xwb0,对它进行归一化处理,使对线性可分样本d集(x,yii),i12,,,n,xR,y{11},,满足ywxii[()+b]10,i12,,,n····································(2.5)分类间隔就等于2/||w||,从而把最大化问题转化为最小化||w||。因此,我们得到最优10 第2章基支持向量机理论基础分类面。而支持向量就是在两条平行线H,H上的样点。即SVM的学习可以描述为如12下问题:12min||w||2···································(2.6)s.t.ywx()+b1,i12,,,nii目标函数是二次的,而约束条件在w和b上是线性的,因此这是一个凸优化问题,通过引入拉格朗日乘子可以很好的解决,新的目标函数称为该优化问题的拉格朗日算子n1Lw,b,(α)=(ww)αi{[(ywxii)+b]1}·····························(2.7)2i1分别对参数w和b求导,并令其等于零得Lw,b,(α)=0w·················································(2.8)Lw,b,(α)=0b由式(2.8)得到nwαiiiyxi1···················································(2.9)nαy0iii1经过转换,由沃尔夫的对偶理论,可以把上述问题转化为如下的对偶问题,把式(2.9)带入式(2.7)中得nn1minαiαjyyxxij(ij)αiα2i,j11ins.t.yiiα0·································(2.10)i1α0,i12,,,ni其中,α为拉格朗日乘子,与第i个样本相对应,这是一个二次规划问题,含有不等式约i束条件存在唯一解,参数b可由下式计算1by(iαiyxxi(i))··································(2.11)NNSVxijJNxJ最后得到最优分类函数是nfx()sgnwx{()b}sgnαiyxxi(i)+b························(2.12)i1式中sgn()为符号函数。对于非线性问题,即当样本点无法线性分开时,会产生一定的误差,可以通过引入误差变量ξi0i12,,,n,如图2.5所示:11 吉林大学硕士学位论文H1HH2wx+b=-1+ξwx+b=-1间距=2/||w||图2.5带误差的最优分类面示意图式(2.6)的约束条件变为如下形式:ywxi[(i)+b]1ξi,i12,,,n·································(2.13)优化问题也相应的变为n12min||w||Cξi2i1s.t.(ywx)+b1ξ········································(2.14)iiiξ0,i12,,,ni构造拉格朗日方程,得到nn1minαiαjyyxxij(ij)αiα2i,j11ins.t.yiiα0·································(2.15)i10αC,i12,,,ni其中C为惩罚参数。支持向量机开始时只用在了最简单的分类问题,后来随着其学习能力的优势逐渐体现,便推广到多分类和回归问题。在求解非线性复杂问题时,SVM通过空间的升维,巧妙的将非线性问题变成线性问题,这个升维的过程实际上是通过并引入核函数实现的,核函数不用求解具体映射问题,从而避免了“维数灾难”问题,下文将对核函数进行详细分析。分类、回归等问题实际上是二次规划的问题,并且带有不等式约束条件,当样本数量较大使得问题的求解更加复杂,导致SVM算法暴露出很多缺点,如出现训练时间长、计算速度慢等。鉴于上述问题,Suykens等人提出了一种新型的方法即最小二乘支持向量机算法(LSSVM),它是支持向量机的扩展方式,相比于传统的SVM算法,LSSVM算法所需的参数更少,更具优势。12 第2章基支持向量机理论基础2.2最小二乘支持向量机原理最小二乘支持向量机算法通过约束条件的转换,将不等式问题变成等式问题,把二次规划问题就变成了线性问题。n其基本原理是把n维样本向量xy11,,xy22,,…,xyll,,其中xRi为n维训练样本输入,yR为训练样本输出,i=1,2,…,l,通过非线性变换()从原空间映射到高i维特征空间,其回归函数为Tfx()w()xb··············································(2.16)式中w是权向量,b为偏置量。最小二乘支持向量机的优化问题变为l11T2minJw,ξwwCξi22i1·························(2.17)s.t.ywTφxb=1ξ,i12,,…,liii式中C为惩罚参数,ξi是误差变量。构造拉格朗日函数进行求解:lTLwb,,,=Jw,ywxb1················(2.18)iiiii1式中,i=1,2,…,l,为拉格朗日乘子。根据KKT[52-53]条件,得到如下等式约束条件:ilL0wiyixiwi1lL00iiybi1·····························(2.19)L0CiiiLT0ywixib1i=0i式中i=1,2,…,l,消去w和得到如下线性系统:T00Yb·······································(2.20)YZZ+T1IαlC式中,I为单位阵,TTTZx1y1,,x2y2…,xllyTYyy12,,…,yl···························(2.21)Tl1,2,…,lTα12,,…,l13 吉林大学硕士学位论文T1令=ZZCI,得到1YbllT1Y···············································(2.22)bT1ll得到LSSVM的决策函数为lfxiiKxx,b········································(2.23)i1其中Kxx,为核函数。i2.3核函数与参数选择1.核函数当线性问题无法解决时,核函数就发挥了作用,使用核函数的目的是将所有样本点映射到高维特空间,即xx(),如图2.6所示,它不需要求解映射(x)的具体形式,简化了大量的复杂算法,通过升维的变换,保证了泛化能力,而在高维空间中,又有其特有的线性关系。xx()图2.6利用核函数进行空间变换选择合适的核函数是支持向量中的研究难点之一,不同的模型需要不同种类的核函数,但遗憾的是,至今仍没有关于核函数选取的准则,通常情况下,可以根据以往经验,或者是通过实验的方法取得。常用的核函数[54]主要有以下几种:(1)多项式核函数TdKxx(,)(1xx)···········································(2.24)ijij(2)Sigmoid核函数TKxx(,)tanh(kxx)·······································(2.25)ijij(3)径向基(RadicalBasisFunction,RBF)核函数:2xxiKxx,iexp·······································(2.26)14 第2章基支持向量机理论基础上式中dk0,0,0,0,称为核参数。在这三种核函数中,径向基核函数由于学习能力较强,在实际应用中较为广泛。RBF核函数不仅所需的支持向量个数最小,而且分类预测效果也最好。而多项式核函数的分类性能与RBF核函数相当,但其训练时间要长。综合而言,RBF核函数建模的效果更加优秀。2.参数的选择本文选取RBF核函数,在确定了核函数类型后,就面临着模型参数的选择问题。LSSVM主要包括两类参数的选择,即惩罚参数C和核函数参数,如RBF核函数的核参数等。核参数反映了支持向量之间的相关程度。的大小对支持向量之间联系有很大关系,也反映了机器学习的复杂程度。过大也是机器学习产生欠拟合的原因之一,在选择参数时,应综合考虑他们之间的影响。惩罚参数C是LSSVM中另一个重要参数,惩罚参数的大小衡量了对错分数据的控制,过大和过小均不利于模型的构建,从模型的推广能力来说,惩罚参数要考虑训练时产生的误差,但又不能把模型构建的过于繁杂。参数C的取值较小,训练误差会变大,模型得不到很好的推广,产生“欠学习”;而参数C取值较大,惩罚程度变大,训练的误差会降低,但对数据的识别能力变差,出现“过学习”的情况,模型的推广能力也会受到影响。C和共同作用于LSSVM模型之中,他们之间取值对整个模型的预测精度都有很大影响。在应用LSSVM算法构建模型时,要充分考虑二者的选取。2.4本章小结本章详细介绍了支持向量机的原理。首先,介绍了统计学理论相关知识,为提出支持向量机算法作铺垫;其次,介绍了支持向量机的基本理论,并指出了其缺点,从而引出其扩展形式,即最小二乘支持向量机算法,最小二乘支持向量机所需的参数较少,更利于结合其他算法进行选择;最后对核函数和参数选择进行了叙述,指出了核函数的重要性,说明了最小二乘支持向量机参数选择的重要性。15 吉林大学硕士学位论文16 第3章基于PSO-LSSVM的改进算法第3章基于PSO-LSSVM的改进算法本章首先介绍了LSSVM参数选择的一般方法,引出PSO算法,进而叙述了将两种算法结合时的参数选择及实现过程。最后提出了本文的改进方法,即通过引入增样样本的适应度值来调整PSO优化LSSVM的适应度函数。3.1LSSVM参数选择的意义及方法支持向量机算法中的参数选择问题是十分复杂的,常常会因为使用不恰当的参数而导致预测结果失败,无法满足实际应用。因此,支持向量机模型参数的选择常被认为是该算法从理论走向实际应用的一个关键问题。最小二乘支持向量机的问题表达和求解算法中包含几个待定的参数:一是核函数的种类;一是惩罚参数。核函数间接地描述了支持向量机的高维特征空间,惩罚参数用来平衡模型复杂度和经验风险值。这些参数的确定对支持向量机的学习性能和计算复杂性有很大的影响。合理的参数值可以使LSSVM具有更高的训练精度以及更强的推广能力;反之,不恰当的参数值则能降低支持向量机的学习能力和推广能力。然而,LSSVM在实际应用中关于参数选择的问题仍然没有得到很好的解决。统计学习理论对支持向量机中的参数选择问题给出了一些建议和解释,但是并没有给出理论上的最优方案。参数选择主要有以下几种方法。1、经验法经验法是一种比较简单而且使用效果较好的方法,容易实现。它根据核函数参数与数据集中样本分布之间的一些经验公式,近似确定核函数参数的取值。在构造支持向量机模型时,首先根据经验公式,预先确定核函数参数值。参数一旦确定,在以后的支持向量机构造过程中便不再修改。实验表明,根据经验公式得到的核函数参数值,基本可以满足大部分的分类器设计要求,但是精度往往不尽人意。2、交叉验证法交叉验证法用全部训练样本,既训练学习机器又测试学习机器的泛化能力。它有多种实现方法,其中留一(LOO,Leave-One-Out)交叉验证法对训练样本的利用最经济。LOO方法是从整个数据集中取出一个样本作为测试样本,其余作为训练样本,对所有的样本重复相同的过程,最后根据历次实验结果选取合理的参数。交叉验证方法的局限性在于对训练样本集的划分是否合理直接决定了通过实验方法得到的算法参数的合理性。3、网格搜索方法网格搜索方法(Grid-searchMethod)是一个应用较为普遍的非线性支持向量机参数选取17 吉林大学硕士学位论文的方法,它是先选定一个候选集合,这个集合是由固定步长变化的一组实数构成,并且这个集合中的实数是按下降顺序排列的,从这个候选集合中选取最优的参数,使分离准确率最高的那个集合中的实数就是最优的参数。网格搜索方法可以通过近似或启发式方法避免搜索全部来寻找参数,但是算法会随着参数的增加而增大计算时间。近年来,随着人工智能技术的进步,智能优化算法如遗传算法、模拟退火、蚁群算法、粒子群算法等得到了充分发展,越来越多的研究者将这些优化算法应用于LSSVM等参数的选择中,并在实际应用中取得了比较好的结果。在众多算法中,粒子群算法作为一种并行优化算法,相对于其它算法,其原理更简单、易实现、效率高、搜索速度快,被广泛应用于函数优化、神经网络等模型参数的优化和数据挖掘等领域。因此,本文采用粒子群算法对LSSVM的参数进行优化。3.2粒子群算法粒子群算法来源于社会模型的模拟,自1995年问世至今,取得了长足的发展。该算法是一种全局的搜索算法,同时也是模拟自然界的生物活动和群体智能的一种随机搜索算法。这种算法吸取了人工智能、鸟群觅食、鱼群学习等群理论思想,具备了进化能力。“粒子”是一个折衷的称呼选择,因为既需要将群体中的成员描述为没有质量、没有体积的,同时又需要描述它的速度和加速状态粒子群算法最初是为了图形化模拟鸟群优美而不可预测的运动。通过对动物社会行为的观察,发现群体中对信息的社会共享提供一个演化的优势,并以此作为开发算法的基础。通过加入近邻的速度匹配、并考虑了多维搜索和根据距离的加速,形成了PSO的最初版本。之后引入了惯性权重w来更好的控制开发和探索,形成了标准版本。假设粒子在d维空间活动,其规模为n,则粒子的运动可用数学方法来描述,设第iTT个粒子速度为vivvi12,i,,vid,位置记作xixxi12,i,,xid,将xi代入相应公式计算其适应度值并据此评价粒子i位置的优劣,一般的,称这个公式为适应度函数。把群体中的适应度值最佳的粒子对应的位置记为gb,把粒子i的当前个体最优位置d记为pb,粒子i通过式3.1和3.2来更新速度与位置。idt1tttttvivicr11pbidxicr22gbdxi····························(3.1)tt11txxv·················································(3.2)iiit1tt1t式中v和v分别为粒子i下一时刻和当前时刻的速度,x和x分别为粒子下一时iiii刻和当前时刻的位置。为惯性权重,c1和c2是学习因子,为非负常数,r1和r2是两个[0~1]的随机数。对于公式3.1,第一部分为粒子当前迭代过程中,此时的惯性权重与飞行速度的乘积,它代表了这个粒子本身对当前运动状态的延续与继承,这是由于自身的飞行运动导致的惯性所致;第二部分可理解为认知部分,为粒子自身的学习过程,表示它对本身的一种思考,18 第3章基于PSO-LSSVM的改进算法根据自身以往的经历来指导下一步的行为决策,这是一个增强学习的过程;第三部分为整个种群的社会学习过程,表示了各个粒子间的信息交流和资源共享,粒子之间互相合作,互相影响,在各自的搜索过程中一方面记住了自己的经验,一方面要考虑同伴的经验。心理学假设是粒子群算法中一个经典的理念,在整个种群都在寻找同一认知学习过程时,当粒子自身认为其他粒子的飞行经验较好时,它会适当的调整。粒子飞行过程如图3.1所示。pbidtxit1gbdxitvi图3.1粒子可能移动的三种方向权值的组合式3.1也体现了粒子在寻优过程中,粒子由于接收到其他粒子的影响在不断调整活动空间,可以看到,每一个参数都在决策其活动范围,通过调整参数可以控制粒子是在大空间飞行,还是以较小的步长活动,其中最大速度vmax起着决定性作用。如果将vmax设置过大,粒子可能会一下飞过最优值;如果vmax太小,粒子只能在小范围内活动,无法获得最优解。所以应该限制其值的大小。粒子群算法发挥了群体智能的优势,有如下优点:(1)可以处理联系优化问题,运算相对简单,计算速度快。(2)粒子具有记忆性,粒子可以传递的最佳位置信息,实现信息共享,具有广阔的分布式能力。(3)在算法中所涉及到的参数较少,结构比较简单,容易实现。(4)算法鲁棒性很强,推广能力好,与其他算法的融合性好,对应用环境适应性强。PSO寻优过程可以理解为通过不断的比较每个粒子的适应度值来更新粒子的个体极值与全局极值,从而寻找到最优参数。标准粒子群算法流程如下:(1)初始化。粒子的位置和速度一般通过随机产生,由此可以确定粒子的当前最优位置pbid与群体中最好位置gbd。(2)比较取优。将每个粒子的pbid与群体中的gbd进行比较,优劣的标准一般为评价函数,即适应度函数。如果有其它的粒子位置好于gbd,则更换gbd,如果没有则gbd继续保持不变。(3)粒子更新。通过式(3.1)和(3.2)更新粒子的速度、位置。(4)进行迭代。与预设的结束条件相比,如没达到精度或次数,返回步骤(2)继续往复过程。19 吉林大学硕士学位论文(5)迭代计算。开始下一代的迭代,否则,取当前gbd为最优解。PSO的流程图如图3.2所示。开开始始初初始始化化粒粒子子群群计计算算每每个个粒粒子子新新位位置置的的适适应应性性根根据据粒粒子子适适应应性性更更新新个个体体极极值值与与全全局局极极值值根根据据速速度度位位置置更更新新公公式式更更新新自自己己的的速速度度和和位位置置NN是是否否达达到到最最大大迭迭代代次次数数YY结结束束图3.2粒子群优化算法流程3.3PSO优化LSSVM算法综合支持向量机和粒子群算法的优点,本文将二者结合用粒子的群体搜索来确定LSSVM的参数,再通过合适的适应度函数来评价粒子的优劣,可以建立较好的模型。结合后对粒子群的参数需要做一些调整:1、群体规模群体规模的大小与粒子的维数关系密切,可以想象在大维度空间里,所需的粒子相当庞大,当维数不大时,群体大小N一般取30-50就能取得较好的适应度值,解决一般问题已经足够,而当问题的维数比较大即问题较复杂时时,粒子数可相应取较大值。种群规模如果较为庞大,粒子飞行所带来的计算量也会随之增加,必然带来时间的增加,会降低寻优效率。所以在确定规模的时候要全面考虑。在本文中,根据模型情况,需优化的参数只有两个,因此本文选择群体大小N为30。2、学习因子学习因子c1和c2是调整微粒自身经验与社会(群体)经验在其运动中所起的权重。如20 第3章基于PSO-LSSVM的改进算法果学习因子c10,c20,则微粒没有自身经验,只有社会经验,它的收敛速度可能很快,但在处理复杂问题时,可能容易陷入局部最优点;如果c0,c0,则微粒有自身经12验,而没有社会经验,因为个体间没有交互,但如果c0,c0,则微粒没有任何经验12的信息,微粒将一直以先前的速度飞行,直至问题空间的边界,因此,只能搜索有限的区域,很难找到问题最优解。可以将学习因子c1和c2统一为一个控制参数,假设φcc12,如果φ0,微粒的坐标值只是简单的线性增加;如果φ非常小,则对微粒速度的控制很微弱,因此微粒群运动的轨迹随时间推移而变化得非常缓慢;当φ较大时,微粒的空间位置变化频率增大,速度变化步长也随之增大。3、惯性权重系数惯性权重对算法的收敛性影响较大,当较大时,则算法的全局搜索能力就大,而局部寻优能力就相对弱;同理,当惯性权重较小时,则局部搜索能力较大,而全局搜索能力相对就弱。同时,惯性权重还和粒子的飞行速度相关,当惯性权重大时,飞行速度v大,粒子能在很大的空间搜索,并可能发现较大的解域;当惯性权重小时,速度就小,有利于在当前的解空间附近挖掘更好的解。对于一般问题通常取0.8~1.2之间。此外,粒子群算法还受最大速度vmax和最大位置xmax的约束,最大速度vmax决定了粒子每次迭代是的最大步长,v有利于防止搜索的发散。要对v进行必要的限制,使搜索步maxmax长得以控制,一般可参考经验数据。基于上面的讨论,在本文中,将种群规模设为30;惯性权重在0.8~1.2之间对模型的整体影响并不大,因此取=1;学习因子参考经验数值取cc121.5,1.7。而粒子群算法进行优化的依据是适应度函数f,一般选取学习样本输出与真值的均方误差,下文将对适应度函数作具体说明。3.4改进的PSO优化LSSVM算法3.4.1改进算法原理通过PSO优化LSSVM的参数,算法结构简单,容易实现。标准的粒子群算法通过计算适应度来调整粒子飞行轨迹,最终实现整体粒子群体的寻优。适应度函数f一般选取模型输出值与真值的均方误差(MeanSquareError,MSE),如式(3.3)所示。l12fMSEyoiy··········································(3.3)li1式中l为学习样本个数,yo为模型输出值,yi为真实值。从式3.3可以看出,PSO优化LSSVM参数时,适应度函数取决于模型输出值yo与真实21 吉林大学硕士学位论文值y的均方误差,经过粒子的不断移动,最终寻找到最小的f值。在此过程中,样本的数i量l起了重要作用,如果样本l较大,样本数目采集的较为广泛,其特征信息也比较丰富,对新增样本的识别能力较强,诊断效果会比较好;如果样本l较小,说明学习样本数目较少,样本较为稀疏,样本的特征信息不够全面,对新增样本的识别能力变弱,PSO-LSSVM模型可能会出现识别错误,这也是LSSVM算法不可回避的问题,即对学习数据的依赖性过于敏感。通过提高学习样本的数量即增大l,使其达到一定规模,可以增加PSO-LSSVM模型的识别能力,提高算法的预测效果。但是当学习样本规模l较大时,样本的大量采集非常困难,而且大量学习样本的数据会增加算法的计算量。研究发现,在利用PSO-LSSVM算法处理故障诊断等一些学习样本点之间关联性很强的问题时,如供水管网泄漏诊断问题,可以对学习样本进行一定的处理,来减少样本的采集。因此,本文提出了一种简化样本的方法,即在学习样本中任意选取一个样本,在此样本的基础上提高采集密度,增加样本数量,形成一个新的样本,本文称作增样样本。将增样样本与学习样本的均方误差共同作为PSO算法的适应度函数。使PSO算法在优化参数时既要考虑学习样本的适应度值又要兼顾增样样本的适应度值,从而提高模型的推广能力。学习样本和增样样本的适应度值需要系数调节,本文将其称作权重系数,设为m01m,通过调整m的大小来确定模型整体的适应度函数。此时模型整体的适应度函数变为fNfmMSE1mMSE······································(3.4)Nsq12MSEsyqoyqi···········································(3.5)qi1其中MSE为学习样本均方误差,如式(3.3)所示,MSEs为增样样本均方误差。式中y为增样样本预测值,y为增样样本真实值,q为增样样本个数。qoqi这样在PSO寻优时既要考虑学习样本的均方误差MSE,又要考虑增样样本均方误差MSE,在PSO迭代过程中,模型的整体适应度函数f由于权重系数m的介入对学习样本sN的依赖性减弱,但会提高整个模型的输出精度,而整体的样本数l又不至于过于庞大。3.4.2改进算法流程模型构建和优化流程如图3.3所示。22 第3章基于PSO-LSSVM的改进算法开始初始LSSVM模型的参数初始化粒子速度、位置计算粒子的个体极值、全局最优值用改进粒子群算法更新粒子的个体极值、全局最优值、邻域极值计算粒子的适应度迭代次数加1N所有粒子计算是否完成迭代YY均方差是否小于设置精度?输出粒子结N序列束YN位置迭代次数是否小于最大迭代次数?图3.3改进PSO-LSSVM算法流程图具体步骤为:(1)初始化LSSVM模型的参数。惩罚系数C设置为[1,10000],RBF核函数参数设置为[0.01,100]。(2)初始化PSO种群。初始化个体极值位置pbid及其对应的适应度值pb_val和种id群中最优位置gbd及其对应的适应度值gbd_val。(3)计算每个粒子的适应度fN。比较粒子的适应度函数值fN与pbid_val及gbd_val,找到最优的适应度函数值。如粒子的f较优,则将其所在的位置设为最佳位置,否则gb不Nd23 吉林大学硕士学位论文变。(4)依据式(3.1)和(3.2)更新粒子的速度、位置。(5)进行迭代,如果在此过程中达到结束条件,如设置的精度等,算法收敛,输出最优的参数C和,否则返回步骤(2)继续迭代。(6)将优化好的参数代入LSSVM中进行训练,训练完成后进行故障诊断。3.5本章小结本章详述了PSO-LSSVM算法。首先介绍了PSO算法,阐述了其基本原理,指出了PSO算法优化LSSVM的优越性;其次给出了PSO算法与LSSVM算法结合的过程,并研究了所需的参数设置问题;最后提出了本文的改进方法,即通过调整PSO优化LSSVM时所选择的适应度函数来提高整个模型的预测精度。24 第4章基于PSO-LSSVM算法在城市供水管网中的应用第4章基于PSO-LSSVM算法在城市供水管网中的应用4.1城市供水管网的水力模拟本文使用EPANETH建立某城市供水管网,该软件来源于美国环境保护局,是EPANET的汉化版本,软件功能强大,可模拟大型复杂供水管网,并可跟踪管道水流、节点压力等数据。国外很多学者将其用于优化管网系统,如VasanA,SimonovicSlobodanP[55-56];国内研究人员王郁超[57]、张凤娥[58]等使用该软件对农村管网的设计进行了研究;杨开封[59]等利用EPANETH对中小城市供水管网进行了较为系统的研究;庄宝玉[60]在区域供水管网上也进行了很多研究。越来越多的学者意识到该软件的优越性,并研究了与其他方法的结合来解决供水管网问题[61]。4.1.1供水管网建立的方法EPANETH软件具有全面的水力分析能力,软件通过调整不同节点、管道等参数来模拟出不同的管网系统,软件对管网类型没有限制,易于使用,界面友好,如图4.1。菜单条管网地图窗口工具条状态栏属性编辑器浏览器图4.1EPANETH软件界面25 吉林大学硕士学位论文软件内嵌了常用的水头损失公式,可模拟各种水泵、阀门、蓄水池等部件,而且可根据不同用户类型,单独设置需水量。使用该软件构建城市供水管网的步骤如下:(1)资料收集。城市管网的构建需要大量资料,可先对一个区域的用户类型进行了解,如小区、学校、企业等,分别估算其用水量需求,对大型区域可查询供水企业的相关资料。(2)搭建管网。通过历史资料和经验数据进行管网的搭建,初步建成管网模型,最后实地走访区域,对模型进行校正。(3)设置参数。在模拟管网上进行各个节点属性和管道属性的设置。节点可以是一栋楼或者学校、工厂等,可根据实际情况而定。节点设置属性如图4.2(a),主要包括需水量、标高,管段长度、管径、摩擦系数等。标高是参考面之上的高度,可以是海平面;需水量是节点用户的用水量,可通过供水公司数据和查询用户水表等手段获取。管段设置属性如图4.2(b)所示,主要包括管段的长度、直径和粗糙系数,不同材质的粗糙系数可通过资料获取。(a)(b)图4.2节点和管道属性设置(4)模型校对在上述工作完成后,可以对管网进行最终的模型校对。先通过水力平差计算,保证整个供水管网的平衡,之后采集实际节点的压力和流量等信息,与模拟管网进行比对,同过调整参数来减小误差,使模型最终达到要求。(5)运行分析最后运行管网,可以求得管段流量、流速,节点总水头、压力等信息,再通过调整不同的参数,模拟管网运行的不同工况。建立一个适用于城市供水管网系统泄漏定位的模型是十分复杂的,它不仅需要大量真实的节点、管段等数据,更为重要的是管网系统发生泄漏时的数据采集,因为泄漏的发生26 第4章基于PSO-LSSVM算法在城市供水管网中的应用具有一定的偶然性,很难大规模采集。模拟管网泄漏通常主要有以下几种方法:一是搭建真实管网。由于场地等因素限制,一般只能在实验室进行,按照一定比例将一定区域的管网缩小成模型,这种方法规模较小,不能模拟真实管网运行情况。二是在实际管网上进行实验。通过开闭水阀来模拟泄漏情况,这种方法真实有效,但由于是在实际管网上进行,会对用户正常用水带来影响,而且实验需要多次运行,必然会带来不必要的水资源浪费。三是采用计算机模拟实际管网。将获取到实际管网信息,进行简化合并等处理形成模拟管网,然后再在计算机上对模拟出来的管网进行仿真。这种方法是目前研究学者对爆管状态模拟最常用的方法,该方法经济、应用灵活。根据实际情况,可以综合这三种方法的优缺点进行合适的选择,本文采用计算机模拟的方法,即采用EPANETH水力建模软件对供水管网进行水力模拟,以获取各节点在爆管发生前后的压力变化值。本文在参考相关资料[62]后,建立了静态的城市供水管网模型。4.1.2本文建立的供水管网本文建立的供水管网如图4.3所示,该管网共有88条管段和58个节点,其中包含54个连接节点,3个水源节点和1个水库,水源节点编号为56、57、58,水库节点编号为55,该供水管网总供水能力约为6000L/s。图4.3城市供水管网示意图27 吉林大学硕士学位论文4.2数据采集及各样本的确定4.2.1管网正常压力数据的采集本文采用压力变化值作为研究数据,因为当运行工况发生变化时,压力变化较流量变化等其他信息较为敏感。某个爆点出现泄漏,会对临近管网节点以至整个管网节点的压力都会产生影响,采集这些节点压力数据便可以形成机器学习的数据。本文研究的供水管网正常工况下各节点的压力数据如表4.1。表4.1供水管网正常工况各节点压力数据节点节点节点节点节点节点节点节点编号压力(m)编号压力(m)编号压力(m)编号压力(m)145.561536.052934.354329.25243.451637.113033.794425.46341.731728.303131.204530.81439.001832.053218.584629.52538.941931.913341.654723.88631.192034.453431.774821.79732.192135.473529.304943.98832.642231.933635.735043.14932.592327.543731.065141.631020.262433.573830.055240.621133.512531.453929.285339.241225.662627.204027.135441.731329.732736.324119.861431.532835.684229.444.2.2学习样本的确定在构建模拟管网后,可根据历史经验和管网通过节点的数量来选取爆点,本文选取节点4、16、22、26、35、37六个爆点。供水管网的泄漏模拟可以通过调节软件的需水量设置来实现,从水力学的角度分析,一个节点流量突然增大可以认为是一种泄漏状态,理论上可以对除了监控点外的所有节点进行泄漏模拟,本文选取爆管程度为总供水量的0.5%、1%、1.5%、2%、2.5%,即漏水量分别为30L/s、60L/s、90L/s、120L/s、150L/s五种级别的爆管程度。监测点的选取可根据整体管网的布局来决定[63],本文选取节点10,17,20,32,41五个点为监测点,用以监测节点的压力值。计算出与正常工况的压力差值作为低密度的学习样本,记作学习样本Ⅰ,共计30组如表4.2。28 第4章基于PSO-LSSVM算法在城市供水管网中的应用表4.2学习样本Ⅰ泄漏量监测点1监测点2监测点3监测点4监测点5爆管位置编号A编号BL/s压力差(m)压力差(m)压力差(m)压力差(m)压力差(m)300.450.460.660.500.5611600.920.931.341.001.1322爆点1901.391.412.051.511.7133(节点4)1201.861.892.782.042.30441502.342.383.532.572.8955300.470.480.610.520.58611600.940.961.231.041.17712爆点2901.421.441.861.571.77813(节点16)1201.901.942.492.102.379141502.392.443.132.652.981015300.520.540.900.610.751121601.051.081.821.241.521222爆点3901.581.632.751.872.281323(节点22)1202.122.183.702.513.0614241502.662.744.673.153.841525300.650.630.550.790.601631601.301.271.111.621.211732爆点4901.961.911.682.471.821833(节点26)1202.622.562.253.342.4419341503.293.212.824.243.072035300.540.560.730.660.882141601.091.131.481.341.762242爆点5901.651.702.222.032.642343(节点35)1202.212.282.982.723.5324441502.782.863.743.424.432545300.580.600.640.810.722651601.171.201.291.641.452752爆点6901.771.811.942.492.182853(节点37)1202.372.422.603.352.9229541502.973.043.264.213.663055通过上述方法形成的学习样本,数据的间隔较大为30L/s,样本点较为稀疏,为了对比不同数量学习样本对模型诊断精度的影响,本文将学习样本的爆管程度从30L/s开始,29 吉林大学硕士学位论文以5L/s步进形成高密度学习样本,记作学习样本Ⅱ,学习样本Ⅱ共计150组,本文列举其中一个爆点(爆点2)的数据,如表4.3。表4.3学习样本Ⅱ部分数据(增样样本)泄漏量监测点1监测点2监测点3监测点4监测点5编号L/s压力差(m)压力差(m)压力差(m)压力差(m)压力差(m)300.470.480.610.520.5811350.540.560.710.600.6811400.620.640.820.690.7811450.700.720.920.780.8811500.780.801.020.860.9812550.860.881.130.951.0712600.940.961.231.041.1712651.021.041.331.131.2712701.101.121.441.211.3712751.181.201.541.301.4712801.261.281.651.391.5713851.341.361.751.481.6713901.421.441.861.571.7713951.501.531.961.661.87131001.581.612.071.751.97131051.661.692.171.842.07131101.741.772.281.932.17141151.821.852.382.012.27141201.901.942.492.102.37141251.982.022.592.192.47141302.062.102.702.282.57141352.152.192.812.382.68141402.232.272.912.472.78151452.312.353.022.562.88151502.392.443.132.652.98154.2.3增样样本的确定增样样本可以选取学习样本中的任意一点,下文将对任意性进行研究。本文选取爆点2(节点16)作为增样点,设置增样点泄漏量从30L/s开始,以一定泄漏量范围进行步进,形成增样样本,如表4.3。本文通过实验发现泄漏量间隔为5L/s对于模型的预测精度效果30 第4章基于PSO-LSSVM算法在城市供水管网中的应用较好,故增样样本的间隔选取5L/s。4.2.4测试样本的确定为了验证算法的准确性和全面性,本文在每个爆点均选取测试样本,测试样本间隔为2L/s,基本形成测试的全域覆盖,下面列举爆点1的测试样本如表4.4。表4.4测试样本(爆点1)泄漏量泄漏量泄漏量泄漏量泄漏量编号编号编号编号编号(L/s)(L/s)(L/s)(L/s)(L/s)301562823108313443215828431104136434160286311241384361622883114414053816429031164142540166292311841445421682943120414654417029631224148546172298312441505481742100312645027621023128452278210431304542803106313244.3PSO-LSSVM算法仿真实验在确定了学习样本和增样样本后,就可以构建PSO-LSSVM诊断模型,而后进行仿真实验,本文使用Matlab软件进行仿真验证。4.3.1算法1仿真实验采用学习样本Ⅰ即低密度的学习样本构建PSO-LSSVM诊断模型,本文记作算法1。经PSO算法优化过后,得到的模型参数为C=1510,=0.11,再对爆点1进行测试,仿真结果如图4.4。31 吉林大学硕士学位论文图4.4算法1仿真结果(爆点1)可以看出,算法1对爆点1的测试效果并不理想,测试结果的均方误差达到225.63,无法满足对供水管网的泄漏定位需求,下面对其他5个爆点进行测试,结果如图4.5。(a)爆点2(b)爆点3(c)爆点432 第4章基于PSO-LSSVM算法在城市供水管网中的应用(d)爆点5(e)爆点6图4.5算法1仿真结果从全部预测结果可以看出,算法1对供水管网的故障测试效果并不好,误差较大,这是由于学习样本密度较低,样本点之间较为稀疏,预测结果只在个别点与真实值接近,经验证,这些相近的点即为学习样本点。仿真结果表明,只有当测试点在距学习样本点相近5L/s范围内,模型效果较好,5L/s的范围也是本文选取高密度学习样本和增样样本的依据。当测试样本偏离此范围时,算法出现错误,说明基于PSO-LSSVM算法诊断模型在较低密度学习样本预测上具有局限性。4.3.2算法2仿真实验增加学习样本数量,形成高密度学习样本Ⅱ,构建PSO-LSSVM诊断模型,本文记作算法2。经PSO优化参数后,得到的模型参数为C=808,=0.18,采用优化所得的参数,对爆点1进行测试,结果如图4.6。图4.6算法2仿真结果(爆点1)33 吉林大学硕士学位论文可以看出,提高学习样本密度后形成的模型测试结果较之前有很大提升,结果基本在真值附近波动,经过计算其均方误差仅为0.24,为了说明其结果的通用性,对其余5个爆点进行测试,结果如图4.7。(a)爆点2(b)爆点3(c)爆点4(d)爆点5(e)爆点6图4.7算法2仿真结果从全部测试结果可以看出,在提高了学习样本数量后,算法2测试结果十分精准。各爆点的均方误差比较小,如表4.5。这是由于高密度大规模的学习样本点较为密集,使得诊断模型对样本的识别能力更强,结果也更加准确,也证明了基于PSO-LSSVM算法诊断34 第4章基于PSO-LSSVM算法在城市供水管网中的应用模型可以对大型复杂供水管网进行泄漏定位。表4.5算法2各爆点均方误差表爆点位置爆点1爆点2爆点3爆点4爆点5爆点6均方误差0.240.220.150.080.170.13综上,由不同密度的学习样本构建的PSO-LSSVM诊断模型,对预测结果有很大影响,当学习样本达到一定规模时,预测精度可以得到很大提升。仿真结果表明,当学习样本选取的泄漏量步进为5L/s,所构建的PSO-LSSVM诊断模型具有良好的预测精度。4.4改进的PSO-LSSVM算法仿真实验提高学习样本数量后,PSO-LSSVM诊断模型的精度很高,但样本数量达到150组,较之前的30组增加了4倍,如果学习样本继续增大,则高密度样本的数量会十分庞大,诊断模型的计算时间和复杂度会大大增加,为此本文提出一种减少样本数量的改进算法,即在模型中引入增样样本。4.4.1权重系数的确定将增样样本引入到PSO-LSSVM诊断模型中,粒子群算法优化参数时,需考虑学习样本和增样样本共同的均方误差,二者之间通过权重系数m调节,其取值关乎整个模型的预测精度,m取值较小,表示粒子群优化参数时,整个模型的适应度计算更加偏向增样样本;m取值较大,表示模型更加偏向学习样本数据,其值可通过实验取得。本文以全部的测试样本对6个爆点进行测试,取整体的均方误差进行比较,经过10次实验,得出不同m取值时测试结果与真值的均方误差平均值如表4.6。表4.6不同m值的模型平均均方误差m0.010.10.20.30.40.50.60.70.80.9MSE4.324.024.504.374.724.815.185.956.989.55从表4.6可以看出,当有增样样本介入时,整个模型的均方误差下降明显,m取值并没有呈现线性关系,这是由于LSSVM构建的诊断模型较为复杂,不同m值会使PSO寻找到不同的惩罚参数C和核参数,使得模型的精度有所不同,从具体结果上看,当m取值小于0.6时,模型的均方误差趋于稳定,结果均可以满足模型诊断需求。综合比较,本文选取m的值为0.1。4.4.2仿真结果分析加入增样样本构建PSO-LSSVM诊断模型,经PSO优化后,得到的模型参数为C=6203,35 吉林大学硕士学位论文=5.53,采用优化所得的参数,对爆点1进行测试,仿真结果如图4.8。图4.8改进算法仿真结果(爆点1)可以看出,改进算法测试结果在真值附近波动,为了说明其结果的通用性,下面对其它5个爆点进行测试,结果如图4.9。(a)爆点2(b)爆点3(c)爆点436 第4章基于PSO-LSSVM算法在城市供水管网中的应用(d)爆点5(e)爆点6图4.9改进算法仿真结果仿真结果表明,引入增样样本后,测试结果在真值一定范围内波动,这个波动范围呈现一定的规律,即一个数量级。可以通过一定的规则使整个模型的输出更为准确,为此,本文对改进算法的输出编号进行了研究。常规编号一般采用连续编排,如表4.2方案A,这样会导致不同两个泄漏点编号相邻,例如编号5、6为分别对应爆点1和爆点2两个不同爆点,编号相邻但节点物理位置不同,会导致PSO-LSSVM算法的微小误差带来误报漏点的严重错误。因此,本文采用了表4.2方案B作为编号规则,加大不同爆点的输出编号距离。此外,对编号数字也进行研究,将编号以10为数量级确定爆点,如学习样本中没有的输出编号0规定为爆点1的较小泄漏,6-9规定为爆点1的较大泄漏,依次类推,将预测结果为56-59规定为爆点6的较大泄漏,防止出现误判爆点的错误。为了更直观的比较各种算法的预测结果,本文将以上三种模型分别对爆点1的测试结果绝对误差E进行分析,如图4.10。图4.10绝对误差结果(爆点1)37 吉林大学硕士学位论文Eyy·····················································(4.1)oiEE························································(4.2)l式中E为平均绝对误差,l为样本个数,yo为模型输出值,yi为真实值。可以看出,算法1各测试点的绝对误差较大,呈现较大的波动,平均绝对误差E达到11.73,且测试结果只在学习样本点附近误差较小,说明了模型对学习样本的依赖明显;在提高学习样本数量和密度后,算法2的绝对误差下降明显,平均绝对误差达到0.33;而经过本文增样样本介入后的改进模型,平均绝对误差达到2.12,结合编号规则,可以较好的实现泄漏诊断。对三种算法的泄漏位置和泄漏量进行对比,如表4.7。按照统一的编号规则,在位置判断中,算法1误差较大,在爆点1全部61个点的测试中仅正确23个,正确率仅为37.70%,无法满足实际要求;算法2仅有1个点判断错误,为98.36%,说明通过增加算法的学习样本规模可以提高算法精度,而通过改进后的算法正确率为100%,说明改进算法在泄漏位置预测上是十分准确的。在泄漏量判断中,算法2占有明显优势,其正确个数为46个,正确率为75.41%,改进后的算法正确15个,正确率为24.59%,但是改进算法在样本数量由算法2的150组减少为55组,减少了63%,简化了算法运算。在实际诊断中,泄漏故障的定位精度要比泄漏量更为重要,因为一旦管网发生泄漏,采取紧急措施查找泄漏位置并进行处置是最为紧要的,因此,本文改进算法具有优越性。表4.7不同算法诊断结果(爆点1)算法算法1算法2改进算法平均绝对11.730.332.12误差泄漏位置37.70%98.36%100%正确率泄漏量—75.41%24.59%正确率样本数量3015055(组)4.4.3增样样本的研究为了验证增样样本的任意性,本文在改进算法中,采用了不同增样样本类型分别对爆点1进行测试,分别以爆点1(节点4)作为增样点,设置增样点泄漏量从30L/s开始,以5L/s泄漏范围进行步进,形成增样样本1,依次类推,以爆点6(节点37)作为增样点,设置增样点泄漏量从30L/s开始,以5L/s泄漏范围进行步进,形成增样样本6。仿真结果如图4.11。38 第4章基于PSO-LSSVM算法在城市供水管网中的应用图4.11不同增样样本类型仿真结果(爆点1)从图4.11可以看出,在更换了增样样本类型后,对爆点1的测试结果影响不大,只是在增样样本6介入时,个别样本点超出了标号规则范围,出现定位错误,但整体精度可以接受。分别用不同的增样样本对其它各爆点进行测试,仿真结果如图4.12。(a)爆点2(b)爆点3(c)爆点439 吉林大学硕士学位论文(d)爆点5(e)爆点6图4.12不同增样样本类型仿真结果可见,不同增样样本类型对各爆点测试结果虽然与真值略有波动,但基本都在一个数量级内波动,利用本文的编号规则可以有效的进行预测,从均方误差表(表4.8)也可以看出,模型的误差控制的都非常出色,爆点2、3、4、5、6的测试结果均方误差比爆点1的都要小,其误差精度符合PSO-LSSVM诊断模型的标准。通过上述仿真验证了本文算法对增样样本的选取具有任意性。表4.8不同增样样本类型输出编号均方误差增样样本增样样本增样样本增样样本增样样本增样样本样本类别123456爆点19.329.038.9310.7110.8417.98爆点24.444.294.264.494.568.63爆点31.752.071.354.694.124.16爆点42.493.132.831.421.784.08爆点52.753.653.042.512.073.12爆点63.744.604.024.063.292.03下面对增样样本的数量进行研究,通过逐级增加增样样本数量,对爆点1进行测试,其中,以爆点2作为增样点,设置增样点泄漏量从30L/s开始,以5L/s泄漏范围进行步进,形成的增样样本记为1个增样样本,以爆点2和爆点1作为增样点,分别设置泄漏量从30L/s开始,以5L/s泄漏范围进行步进,形成的增样样本,记为2个增样样本;依次类推,以全部6个爆点作为增样点,形成的增样样本,记为6个增样样本,仿真结果如图4.13。40 第4章基于PSO-LSSVM算法在城市供水管网中的应用图4.13不同增样样本数量仿真结果(爆点1)从仿真结果可以看出,增加增样样本数量,算法测试结果精度并没有提高,与1个增样样本结果基本一致。对其它5个爆点分别进行测试,仿真结果如图4.14。(a)爆点2(b)爆点3(c)爆点441 吉林大学硕士学位论文(d)爆点5(e)爆点6图4.14不同增样样本数量仿真结果可见,增样样本数量的增加并没有改善预测精度,从测试结果的均方误差表(表4.9)也可以看出,各爆点的误差都比较接近。表4.9不同增样样本数量输出编号均方误差样本123456数量爆点19.329.579.478.588.688.39爆点24.444.604.544.084.113.98爆点31.751.881.781.301.501.20爆点42.493.183.122.792.912.69爆点52.753.523.443.043.222.92爆点63.744.284.244.124.284.08综上,本文选取的增样样本具有任意性,只要有增样本介入,粒子群算法在参数寻优时就会综合考虑整个模型的误差,使模型的推广能力变强。样本数量的增加也没有改善测试结果精度。值得一提的是当增样样本数量增加到6个时,实际上已经比算法2的学习样本数量多,但结果并没有改善,因为PSO-LSSVM诊断模型构建时的学习样本并没有变化。说明基于PSO-LSSVM诊断模型对学习样本的依赖十分强烈。4.5本章小结本章首先利用供水模拟软件EPANETH搭建了大型复杂供水管网,并模拟了不同爆点位置不同泄漏量的节点压力,为实验验证提供了数据支持;而后将PSO-LSSVM算法应用到供水管网系统中,利用三种不同诊断模型对测试样本进行测试,分析对比了三种模型的诊断结果,得出在供水管网泄漏检测中,可以增加学习样本的密度来提高模型的预测精度。在城市复杂供水管网发生泄漏时,当学习样本选取的泄漏量步进为5L/s时,所构建的PSO-LSSVM诊断模型具有很好的预测精度。最后,重点研究了利用改进算法模型进行诊断的方法,并对增样样本的选取进行了研究,给出了增样样本选取的方法。42 第5章总结与展望第5章总结与展望5.1工作总结城市供水管网泄漏定位技术的研究是管网安全健康运行的关键,世界各国都十分重视供水管网泄漏的检测与控制。随着众多新技术和新手段应用,支持向量机越来越受到漏损行业的重视。至上个世纪90年代以来,支持向量机的研究发展到现在已经有了四十多年的历史,其研究也从理论方面逐步转向了工程实际应用方面,支持向量机其本质是一个模式识别分类问题,能够根据数据的特征进行分类,对故障诊断尤其适用。本文针对供水管网的泄漏定位技术进行了研究,将最小二乘支持向量机算法应用到管网的泄漏定位上,在模型参数寻优处理上通过粒子群算法进行了优化,并在模型中引入增样样本来提高模型推广能力,最后通过EPANETH软件模拟城市复杂供水管网,经过实验验证,本文提出的算法能够在较少样本的前提下,较好的实现了复杂管网的定位。主要做了以下工作。1、分析了国内外供水管网泄漏定位技术,介绍了管道泄漏检测的各种方法和实际应用的各种手段,指出了未来通过智能算法解决泄漏定位是发展趋势。2、阐述了支持向量机算法和粒子群算法,并将二者相结合,讨论了这两种算法所涉及到参数的选择,构建了基于PSO-LSSVM算法的故障诊断模型,研究了不同数量的学习样本对诊断结果的影响,得出在城市复杂供水管网出现泄漏时,学习样本选取的泄漏量步进为5L/s,所构建的PSO-LSSVM诊断模型具有良好的预测精度。3、提出了一种简化样本的方法,即引入增样样本,通过调整增样样本在粒子群算法参数优化的权重来提高模型的整体推广能力,并在管网中进行了验证。通过增样样本的介入使PSO在LSSVM参数寻优时既要考虑学习样本的特征信息又要兼顾整个模型的推广能力。5.2工作展望支持向量机在供水管网中有其独特的优势,本文虽然通过减少样本的获取实现了故障定位,但仍有待改善的空间。1、本文改进算法虽然能实现定位,但在泄漏量上预测不够准确,下一步可以结合其它方法进行联合预测。2、在支持向量机参数的寻优过程中,粒子群算法仍然有一些缺陷,如易陷入局部最小值,可对粒子群算法进行进一步的改进研究。3、本文研究的泄漏情况没有考虑管网的微小泄漏,供水管网的微小泄漏对管网的危害也非常大,可进行深入研究。43 吉林大学硕士学位论文44 参考文献参考文献[1]孙福强.国内外供水管网漏损管理技术与指标浅析[J].城镇供水,2013(6):64-66.[2]袁志彬.我国城市供水管网漏失率状况及其管理措施[J].城市管理与科技,2004,6(2):82-84.[3]SaqibNU,MysorewalaMF,ChededL.AMultiscaleApproachtoLeakDetectionandLocalizationinWaterPipelineNetwork[J].WaterResourcesManagement,2017,31(12):1-14.[4]HuangY,WangQ,ShiL,etal.Underwatergaspipelineleakagesourcelocalizationbydistributedfiber-opticsensingbasedonparticleswarmoptimizationtuningofthesupportvectormachine.[J].AppliedOptics,2016,55(2):242-247.[5]LatchoomunL,KingRTFA,BusawonK.Anewapproachtomodeldevelopmentofwaterdistributionnetworkswithhighleakageandburstrates[J].ProcediaEngineering,2015,119(1):690-699.[6]MysorewalaM,SabihM,ChededL,etal.ANovelEnergy-AwareApproachforLocatingLeaksinWaterPipelineUsingaWirelessSensorNetworkandNoisyPressureSensorData[J].InternationalJournalofDistributedSensorNetworks,2015(1):1-10.[7]KayaalpF,ZenginA,KaraR,etal.Leakagedetectionandlocalizationonwatertransportationpipelines:amulti-labelclassificationapproach[J].NeuralComputing&Applications,2017(28):1-10.[8]AyadiA,GhorbelO,BensalehMS,etal.OutlierdetectionbasedondatareductioninWSNsforwaterpipeline[C]//InternationalConferenceonSoftware,TelecommunicationsandComputerNetworks.2017:1-6.[9]宋羽.给水管网漏损的检测措施及原因分析[J].市政技术,2008,26(1):8-9.[10]XiaoQ,LiJ,BaiZ,etal.ASmallLeakDetectionMethodBasedonVMDAdaptiveDe-NoisingandAmbiguityCorrelationClassificationIntendedforNaturalGasPipelines[J].Sensors,2016,16(12):1-16.[11]刘锁祥,王耀文.北京市供水管网漏损状况及控制措施[J].城镇供水,2004(4):41-43.[12]DuanHF.UncertaintyAnalysisofTransientFlowModelingandTransient-BasedLeakDetectioninElasticWaterPipelineSystems[J].WaterResourcesManagement,2015,29(14):5413-5427.[13]李永光,李文建.相关检漏仪的原理及应用[C]//全国供水管网信息化管理与检测技术应用研讨会.2005:66-70.[14]FuchsHV,RiehleR.Tenyearsofexperiencewithleakdetectionbyacousticsignal45 吉林大学硕士学位论文analysis[J].AppliedAcoustics,1991,33(1):1-19.[15]WaynehennigarG.WaterLeakageControlandSonicDetection[J].CanadianWaterResourcesJournal,1984,9(3):51-57.[16]PilzerJE.Leakdetection-casehistories[J].Journal,1981,73(11):565-568.[17]ShoreDG.EconomicOptimizationofDistributionLeakageControl[J].Water&EnvironmentJournal,2010,2(5):545-551.[18]McintoshPT.WaterResourcesDevelopment:ABalancedApproach[J].Water&EnvironmentJournal,2010,7(4):412-417.[19]FuchsHV,RiehleR.Tenyearsofexperiencewithleakdetectionbyacousticsignalanalysis[J].AppliedAcoustics,1991,33(1):1-19.[20]LaineDL,DarilekGT.Detectingleaksingeomembranes[J].CivilEngineeringASCE;(UnitedStates),1993,63:8(8):50-53.[21]HoltschulteH,LaskeC,HellasJ,etal.Recenttechniquesinleakdetection[J].IwsaGeneralReport,1988:4-8.[22]ShinodaT.Waterleakagemanagementbydistributioncontrolviatelephonelines[J].WaterSupply,1999,17(3):121-127.[23]肖艳,张伟.音听检漏法在消防管道检漏中的应用及降低给水管道漏耗的思考[J].中国科技纵横,2011(4):250-254.[24]袁成忠.地下供水管道检漏主要方法和仪器的应用[J].今日科苑,2007(18):140-140.[25]王桂增,叶昊.流体输送管道的泄漏检测与定位[M].清华大学出版社,2010.[26]曹燕龙,王为民,葛磊,等.压力梯度法定位管道泄漏点的数值模拟[J].辽宁石油化工大学学报,2014,34(2):45-48.[27]王长建,叶伟文,肖超波,等.负压波在管道泄漏检测与定位中的应用[J].管道技术与设备,2009(6):27-28.[28]杨进,文玉梅,李平.泄漏声振动传播信道辨识及其在泄漏点定位中的应用[J].振动工程学报,2007,20(3):260-267.[29]SangHK.ExtensiveDevelopmentofLeakDetectionAlgorithmbyImpulseResponseMethod[J].JournalofHydraulicEngineering,2005,131(3):201-208.[30]MpeshaW,GassmanS,ChaudhryM.Leakdetectioninpipesbyfrequencyresponsemethod[J].JournalofHydraulicEngineering,2001,127(2):134-147.[31]S.R.Mounce,J.B.Boxall,J.Machell.OnlineapplicationofANNandfuzzylogicsystemforburstdetection[C].Proceedingsofthe10thAnnualWaterDistributionSystemsAnalysisConference,KrugerNationalPark,SouthAfrica.2008:735-746.[32]GoodwinSJ.Resultsoftheexperimentalprogrammeonleakageandleakagecontrol[J].WrcTechnicalReport,1980(1):150-154.[33]HikiS.RelationshipBetweenLeakageandPressure[J].JournalofJapanWaterworks46 参考文献Association,1982,12(5):50-54.[34]MayJ.PressureDependentLeakage[J].WorldWaterEnvironEng,1994(10):15-19.[35]GermanopoulosG,JowittPW.LEAKAGEREDUCTIONBYEXCESSPRESSUREMINIMIZATIONINAWATERSUPPLYNETWORK[J].ProceedingsoftheInstitutionofCivilEngineersPartResearch&Theory,1989,87(2):195-214.[36]GermanopoulosG.Atechnicalnoteontheinclusionofpressuredependentdemandandleakagetermsinwatersupplynetworkmodels[J].CivilEngineeringSystems,1985,2(3):171-179.[37]PudarR,LiggettJ.Leaksinpipenetworks[J].JournalofHydraulicEngineering,1992,118(7):1031-1046.[38]Vıos,LiggettJA,SimpsonAR,etal.OptimalMeasurementSiteLocationsforInverseTransientAnalysisinPipeNetworks[J].JournalofWaterResourcesPlanning&Management,2003,129(6):480-492.[39]KrohnN,BusseG.LeakDetectioninPipelinesusingtheDampingofFluidTransients[J].JournalofHydraulicEngineering,2002,128(7):697-711.[40]唐秀家,颜大椿.基于神经网络的管道泄漏检测方法及仪器[J].北京大学学报:自然科学版,1997,33(3):319-327.[41]朱东海,张土乔,毛根海.城市给水管网爆管点动态定位的神经网络模型研究[J].水利学报,2000(5):1-5.[42]肖笛.城市给水管网爆管事故在线监测研究[D].天津大学,2007.[43]李炜,邝鹏.基于遗传优化的模糊神经网络在管道泄漏检测中的应用研究[J].科学技术与工程,2008,8(13):3490-3494.[44]MashfordJ,SilvaDD,MarneyD,etal.AnApproachtoLeakDetectioninPipeNetworksUsingAnalysisofMonitoredPressureValuesbySupportVectorMachine[C]//InternationalConferenceonNetworkandSystemSecurity.IEEE,2009:534-539.[45]TeraoY,MitaA.Robustwaterleakagedetectionapproachusingthesoundsignalsandpatternrecognition[C]//The,InternationalSymposiumOn:SmartStructuresandMaterials&NondestructiveEvaluationandHealthMonitoring.InternationalSocietyforOpticsandPhotonics,2008:6932-6938.[46]MashfordJ,SilvaDD,BurnS,etal.LEAKDETECTIONINSIMULATEDWATERPIPENETWORKSUSINGSVM[J].AppliedArtificialIntelligence,2012,26(5):429-444.[47]RashidS,AkramU,QaisarS,etal.WirelessSensorNetworkforDistributedEventDetectionBasedonMachineLearning[C]//InternetofThings.IEEE,2015:540-545.[48]赵艳燕,刘娜.基于支持向量机管道泄漏信号的特征选择研究[C]//全国信息获取与处理学术会议.2008:453-457.[49]韩阳,王威.给水管网实时故障诊断的支持向量机模型[J].给水排水,2007,47 吉林大学硕士学位论文33(2):109-112.[50]李楠楠,郄志红,古田均.供水管网爆管故障诊断的PSO-SVM方法[J].系统工程理论与实践,2012,32(9):2104-2110.[51]齐成伟,曹欣欣,郄志红,等.基于HHT和SVM的供水管网爆管诊断模型研究[J].水电能源科学,2017(2):153-156.[52]BurgesC.Geometryandinvarianceinkernelbasedmethods[C]//AdvancedinKernelMethods-SupportVectorLearning.Cambridge,MA:MITPress,1998:640-646.[53]ShevadeSK,KeerthiSS,BhattacharyyaC,etal.ImprovementstotheSMOalgorithmforSVMregression[J].IEEETransactionsonNeuralNetworks,2000,11(5):1188-1193.[54]BurgesCJC.Atutorialonsupportvectormathinesforpatternrecognition[J].DataMiningandKnowledgeDiscorvery,1998,2(2):121-167.[55]JayalakshmiM,GomathiV.AnenhancedundergroundpipelinewaterleakagemonitoringanddetectionsystemusingWirelesssensornetwork[C]//InternationalConferenceonSoft-ComputingandNetworksSecurity.IEEE,2015(1):1-6.[56]Vasan,Simonovic,SlobodanP.OptimizationofWaterDistributionNetworkDesignUsingDifferentialEvolution[J].JournalofWaterResourcesPlanning&Management,2010,136(2):279-287.[57]王郁超,陶月赞,郭增辉.EPANET软件在农村供水管网设计中的应用[J].市政技术,2011,29(2):58-60.[58]张凤娥,曾念,张敏,等.用EPANET水力模型优化乡镇供水管网[J].中国给水排水,2008,24(2):43-45.[59]杨开峰.中小城市供水管网EPANET水力模型的建立和应用研究[D].华中科技大学,2016.[60]庄宝玉.区域供水管网规划的优化研究[D].天津大学,2012.[61]CobachoR,ArreguiF,SorianoJ,etal.Includingleakageinnetworkmodels:anapplicationtocalibrateleakvalvesinEPANET[J].Aqua,2015,64(2):130-138.[62]李艳兰.城市供水管网漏失定位的研究[D].华南理工大学,2011.[63]林雨阳.城市供水管网实时监控系统的设计与监测点的优化布置[D].华南理工大学,2013.48 作者简介及在攻读硕士期间取得的科研成果作者简介及在攻读硕士期间取得的科研成果作者简介:吴雷,男,汉族,1983年7月出生于吉林省东丰县。2006年6月毕业于海军工程大大学通信工程专业。现为吉林大学通信工程学院电子与通信工程专业硕士研究生,主要研究方向为机器学习,水管检测。联系方式:Tel:E-mail攻读硕士期间的科研成果:1、在校期间参加的科研项目[1]基于物联网的供水管网采集及监测系统.吉林省省级产业创新专项资金项目(2017C031-1)[2]基于低功耗广域网的城镇供水管网监测关键技术研究.吉林省科技厅重点科技研发项目20180201081SF.2、在校期间发表的论文李娟,步贺,卢秋悦,吴雷.基于ZigBee的供水管道泄漏监测节点的设计.吉林大学学报(信息科学版),2016(7).49 吉林大学硕士学位论文50 致谢致谢行文至此,思绪万千。转眼间我的研究生生涯即将结束,在此,我要向所有关心、帮助过我的老师、同学致以最真诚的感谢。首先,向我的导师李娟献上最诚挚的感谢!老师在我的学习和研究过程中给予我诸多指导,她严肃认真的工作态度深深影响着我。其次,感谢同实验组的同学,他们是步贺、刘晓龙、卢秋悦、孟可心、王代香、计硕、郑强、李元、刘延林、王聪。尤其是计硕,三年的学习中给我很大帮助。与你们一起学习我很幸福。缘分让我们在吉林大学相遇,一起学习、共同进步让我倍感骄傲。最后,我还要向我的家人表达我最诚挚的谢意。感谢父母多年来对我培养,感谢爱人马康平对我求学的支持,你们的爱是我不断学习、迎接挑战的动力!51'