• 2.98 MB
  • 2022-04-22 11:43:40 发布

基于回归树的城市供水管网状态估计研究

  • 72页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'分类号密级UDC学号201520959449NorthChinaUniversityofWaterResourcesandElectricPower专业硕士学位论文基于回归树的城市供水管网状态估计研究田嘉导师姓名、职称刘建华教授平源副教授专业学位类别工程硕士专业领域计算机技术培养方式全日制培养学院信息工程学院论文提交日期2018.4论文答辩日期2018.5.24 分类号:密级:UDC:单位代码:10078华北水利水电大学专业硕士学位论文基于回归树的城市供水管网状态估计研究StudyOnStateEstimationofUrbanWaterSupplyNetworkBasedonRegressionTree研究生姓名:田嘉指导教师:刘建华平源专业名称:计算机技术所在学院:信息工程学院2018年4月 摘要基于回归树的城市供水管网状态估计研究摘要规模庞大、布局繁杂、强扰动是城市供水管网系统的主要特征,展开预测建模可以更好地掌控其运行规律,促进日常调度、运行优化及应急处理能力。为此,本课题以对城市供水管网的水力模型进行建立并进行相关的运行状态估计工作。以中原某市自来水厂实验管网为例,采用运行与监控数据和实验管网数据库中收集整理的相关数据,建立了实验管网的水力模型。经由对比可知,该模型与实际管网运行状态趋于一致,模拟压力值与测量值的平均绝对误差为0.0021MPa,建成的水力模型精度较高。由于城市供水管网监测点较少,收集到的历史数据有限,不能有效反应管网的运行状态的规律。选取中原某市某区域作为研究对象,该区域中共有12个监测点,基于该区域的实际运行数据,建立基于回归树的两种预测模型。采用CART回归树和模型树对训练数据进行递归构建二叉树,得到预测模型并选取该区域中的监测点11、监测点12的压力值进行预测。最后,该区域实验情况如下:CART回归树模型对监测点11、监测点12的预测压力与实测压力的误差在5%以内,模型树对监测点11、监测点12的预测压力与实测压力误差在10%左右。经过实验得到,CART回归树模型的预测误差较低且能对单个或多个监测点进行预测,预测效果较好,对管网运行状态的估计有一定的指示作用。关键词:城市供水管网;状态估计;CART回归树;模型树I 华北水利水电大学硕士学位论文StudyonstateestimationofurbanwatersupplynetworkbasedonregressiontreeABSTRACTTheurbanwatersupplynetworksystemisadynamicnetworksystemwithlargescale,complexstructureandstrongdisturbance.Tocarryoutpredictionmodelingcanbettermasteritsrunningrulesandimprovetheabilityofdailyscheduling,operationoptimizationandemergencytreatment.Themaincontentofthisprojectistoestablishahydraulicmodelofurbanwatersupplynetworkandestimatetherunningstateofurbanwatersupplynetwork.First,basedontheactualdataoftheexperimentalpipenetworkinacityofcentralplainareawaterworksandthedataoftheexperimentalpipenetworkbuiltbythewaterplant,thetopologicalstructureoftheexperimentalpipenetworkisestablishedbycombiningthefieldsurveydata,andthehydraulicmodeloftheexperimentalpipenetworkisestablished.Thehydraulicmodeloftheexperimentalpipenetworkisasfollows:themodelisconsistentwiththeactualrunningstateofthepipenetwork,theaverageabsoluteerrorofthesimulatedpressurevalueandthemeasuredvalueis0.205m,andthebuilthydraulicmodelhasahigherprecision.Secondly,forlargecities,therearefewmonitoringpointsofthewatersupplynetwork,andthestatevariablesarelimited,whichcannotfullyreflectthestatusoftheoperationofthepipelinenetwork.Aregionofcentralplainareaisselectedastheresearchobject.Thereare12monitoringpointsinthisarea.Basedontheactualoperationdataoftheregion,twoforecastingmodelsbasedonregressiontreeareestablished.CARTregressiontreeandmodeltreeareusedtoconstructtwoforkedtreeoftrainingdatarecursively.ThepredictionmodelisobtainedandthepressurevaluesofRTU11andRTU12inthisareaarepredicted.Finally,themodelexperimentinthisareaisasfollows:theerrorbetweenthepredictedpressureandthemeasuredpressureoftheCARTregressiontreemodelforRTU11andRTU12islessthan5%,II ABSTRACTandtheerrorofthepredictionpressureandthemeasuredpressureofthemodeltreetoRTU11andRTU12isabout10%.Throughtheexperiment,thepredictionerroroftheCARTregressiontreemodelislowandcanpredictthesingleormultiplemonitoringpoints.Thepredictioneffectisgood,andithasacertainindicationeffectontheestimationoftherunningstateofthepipenetwork.KEYWORDS:Urbanwatersupplynetwork;stateestimation;CARTregressiontree;modeltreeIII 目录目录摘要.................................................................................................................................IABSTRACT..................................................................................................................II1绪论............................................................................................................................11.1引言.................................................................................................................11.2国内外研究情况.............................................................................................21.2.1城市供水管网建模研究现状..............................................................21.2.2城市供水管网状态估计研究现状.......................................................31.3本课题研究意义.............................................................................................41.4本课题主要研究内容.....................................................................................41.5本章小结.........................................................................................................52城市供水管网水力模型的建立及应用....................................................................72.1城市供水管网图形简化.................................................................................72.2城市供水管网模型的数据准备.....................................................................72.3城市供水管网水力模型计算方法分类..........................................................82.4EPANET2.0管网水力计算方法..................................................................102.5城市供水管网水力模型实例分析...............................................................112.5.1城市供水管网水力模型建立流程....................................................112.5.2实验管网数据收集............................................................................122.5.3管网EPANET可视化建模..............................................................132.6本章小结........................................................................................................173决策树算法基本理论..............................................................................................193.1分类树...........................................................................................................203.2回归树...........................................................................................................213.2.1CART回归树.....................................................................................213.2.2模型树.................................................................................................223.2.3回归树算法的步骤.............................................................................233.3CART决策树的剪枝....................................................................................243.4本章小结.......................................................................................................254城市供水管网状态估计研究..................................................................................274.1管网状态估计方法........................................................................................274.2回归树算法数据处理....................................................................................284.3回归树算法在供水管网中的应用................................................................29I 华北水利水电大学硕士学位论文4.3.1CART回归树在供水管网中的应用.................................................304.3.2模型树算法在供水管网中的应用.....................................................384.4回归树算法实验结果分析...........................................................................424.5本章小结.......................................................................................................425总结与展望..............................................................................................................45致谢..............................................................................................................................47参考文献......................................................................................................................49附表..............................................................................................................................53II 1绪论1绪论1.1引言随着现代化和信息化的发展,作为最重要的市政基础设施,城市供水管网逐渐走进了人们的生活,并受到国家和相关机构的高度重视。目前,我国供水管网系统的管理绝大多数依赖于人工,技术水平低,难以发现问题,供水企业的改造跟不上城市的发展速度。作为地下管道,城市供水管网受到压力、外部负荷变化或旧的管道腐蚀的影响,导致管网泄漏或爆炸。这不仅会损失大量的清洁能源,而且在一定程度上可能会对城市中的其他基础设施造成灾难性的损害。为了有效解决这些问题,实时监测供水管网系统的运行状态,如水压,水量等,对管网的运行状态进行实时监控。再次,通过对其状态的监控可以进行用水安全评估,包括供水可靠性(满足用水户要求)、安全性(用水质量、水压不构成对用户的危害、日常用水不间断等)。供水管网体系管理工作的平台,是由各个供水企业利用计算机建立相应的模型得到。以此模型建立相应的水量、水质的监控和预警平台,这对于城市居民日[1]常用水安全具有极大的意义。同时,管网相关水力水质模型的建立也给其日常管理工作带来了极大的方便。本文的主要研究内容是供水管网水力模型的建立,水质模型的建立尚未讨论。状态模拟的目的是将静态和动态数据通过管网状态方程结合在一起,进行水[2]力分析,得到与实际运行状态相符合的状态参数,是城市供水管网进行水力模拟的主要内容,通过对城市供水管网运行状态模拟的研究,确定符合实际运行规律的城市供水管网运行状态参数,实时对管网的运行情况进行监控。对于某些大中型城市的供水管网而言,由于遥测费用等各方面因素的影响,设置的SCADA[3]监测点较少,采集的状态变量有限、不能有效地、全面地反映管网的运行状态。因此,需要根据数据挖掘找出数据之间的关系,根据现有监测点信息来推求其他位置信息,达到扩充信息量的目的,使得城市供水管网运行状态估计更加准确。回归算法是数据挖掘领域中在解决预测问题所必要的核心工具,采用相关回归算法对于开展预测方面的课题有着重要的作用,能够较好的解决实际应用中存在的预测问题。常见的回归算法有:基于线性模型的回归算法、人工神经网络、[4]基于树模型的回归算法。利用回归算法对未知变量的预测,可以得到很好的效果,对于供水管网运行状态的估计具有重要意义。1 华北水利水电大学硕士学位论文1.2国内外研究情况1.2.1城市供水管网建模研究现状城市供水管网具有复杂的拓扑结构、超大规模、强变化等的特点。以往对于埋在地下的供水管网采取经验性的管理,不能直接进行检测,难以实现管理的科学化和现代化。国内外学者为了更加全面对管网运行水力状态进行了解,因此对[5]于管网建模知识进行了大量的深入研究。[6]城市供水管网建模一般包括水力建模和水质建模。在水力模型中,通过对管网各个节点的压力值、用水量以及供水泵站的流量等参数关系进行描述,深入研究各参数之间的关系,对供水管网的运行状态信息进行观测。是以,创建与真实供水管网情况相符合的工况,是实现供水管网优化运行的必要条件。本文侧重于研究供水管网系统水力建模。在本文中,我们主要研究建立城市供水管网水力模型,经过国内外专家学者的钻研,提出了通过微观和宏观两个方面进行水力建模研究。与我国城市供水管网不同的是,国外的供水管网规划更为科学,运行监控信息完善,相关管网的资料保存完整,运行监控数据量丰富,有利于进行微观模型的建立,通过对这些因素的考虑,国外的专家学者主要针对微观模型进行研究;我国的管网信息不完备,运行监控系统的安装与布置需要进行重新规划且规划难度较高,管网模型很难以国外研究得到的经验进行建立,因此,不能照搬国外经验,只能针对我国国情进行宏观建模研究。在国内,同济大学的杨钦教授在20世纪80年代最早提出了修正流量分配法,并对于该方法进行相应的程序设计,将计算机技术引入到供水管网建模和模拟仿[7]真领域,并设计了相应的计算机程序,填补了我国在供水领域的空白;进入90年代,以袁一星为代表的众多专家学者在该领域积极进行研究学习,通过研究学习后,对我国供水事业贡献出自己的一份力量,正是有了他们的突出贡献,使得[8]我国的水力模型研究工作可以更加深入的发展。在国内,近年来,建立了佛山、深圳等较多城市的供水管网水力模型,而且使本国所建立的水力模型成功的进行应用,并在此过程中进行不断更新和维护,通过对供水管网相关理论的深入研究,[9]对于建模的经验有了很多的积累。在国外,20世纪80年代,伴随着商品化软件的开发和应用,开始关注准稳态水压模拟系统。就目前而言,国外有很多主流的进行水力模拟的软件,例如,Wallingford开发的nfoWorksWS,丹麦DHI开发的MikeUrban,美国环保局自[10]主研发的EPANET等。Jamieson、Shamir、Martinez和Franchini首先使用仿真软件EPANET构建城市供水网络微观模型,将建立开放泵的数量、阀门开度以及用户需求作为供水网络模型的输入,供水网络模型的输出是节点的水压力,2 1绪论并使用EPANET为输入输出样本做了大量不同输入的模拟计算。在得到大量运行与监测数据的情况下,采用BP神经网络算法建立了供水管道网络的宏模型,将建立好的网络模型用于海法和瓦伦西亚城市,这样可以使得能源的消耗减少到[11]最低。1.2.2城市供水管网状态估计研究现状实测模拟法、宏观模型法和状态估计法是城市供水管网中最常使用的三种方法。管网模型法的模拟方式是指在管网中放置一些数量的压力和流量监测表,以明确采集的是节点的压力和管段的流量。由于安装成本较高,所以监测点较少,这种方法对于管网仿真并不是很全面;对于宏观模型法而言,基于统计分析的经验数学表达,宏观模型主要对大量的现有运行数据进行回归分析,建立起来的一[12]种经验性的数学表达式。宏观模型法的思路是,对大量运行与监控数据做回归分析以计算出涉及的配水网调度的供水水压、供水量等几个主要变量,方程之间建立宏观变量之间的关系,这样便可以对供水管网各节点处的压力进行预测;状态估计法主要是利用运行与监控时采集到的节点压力、流量等少量相关变量,结合管网中各个参数之间的内部关系推导出其他相关状态变量信息,以达到实时仿真的效果。由此,结合以上三种模拟方法的使用范围,通过运行与监控数据来进行状态模拟,可以选择宏观模拟法和状态估计法进行预测。宏观模拟法主要是对时间上[13]的预测,对对管网某个时间段的节点流量、压力进行预测;状态估计法主要针对空间上的预测来达到扩充信息量的目的,从而对管网的运行状态能够更好的了解。本文主要是针对状态估计法进行研究。城市供水管网状态估计方法对其运行情况的研究具有重要意义,正是如此,国内外专家学者有了很深入的研究。首先,通过考虑影响管网状态变化的主要因素是水源清水蓄水水位和用户的水量,由于某段供水管网变化不大,故可以采用固定的调度方案,由吴学伟、赵洪宾提出该方法。但该方法有一定的局限性,如果管网用水量变化很大时,需要重新进行新的状态估计模拟;吕谋、陈磊等人将神经网络运用到管网状态估计中,由于遗传算法存在收敛速度慢等问题,引入自适应遗传算法优化网络的权阈值,用来搜寻最优拓扑结构,并利用混沌遗传算法[14]全局优化权阈值,建立基于改进BP网络的宏观管网状态模型;黄廷林、丛海兵等人提出了一种改进的状态估计权重和的数学模型,采用简约梯度法求解,估算的参数是所有的节点水压,测量参数是各水源供水量、部分节点水压、管段流量;国外相关学者提出用加权最小二乘法估计管网状态。这个模型有严格的使用条件。该方法求解稳定,不适合我国实测参数不小于估计参数时的实际情况。3 华北水利水电大学硕士学位论文1.3本课题研究意义根据国情出发,考虑到我国供水管网系统的特点,不易进行人工观察和管理。建模还未形成时,供水管网的管理均为经验管理,不能直接进行试验和大量的测[15]试。由于计算机技术的发展,国外研究人员对供水管网系统的计算机仿真理论进行研究,并在供水管网模型的建立范围及实际应用中做了大量的研究工作。固然我国在供水研究方面来说,研究时间比较落后,历经多年的不懈努力,取得了一些不斐的成就。为了能更好的展示管网的运行状态,便于对管网运行状态的深入研究,采用计算机的方法,利用EPANET2.0对管网进行可视化建模。目前国内绝大多数自来水公司都在管网上安装监测点,实时监控的所有数据被送回运营部门,作为供水企业的优化运行依托。考虑到成本等其他方面的因素,监测点设备的数量是有限的,且得到的结果仅仅表示在局部实时运行数据。要更加准确的了解管网的运行状态,对管网系统收集的SCADA数据进行挖掘,通过已知监测点的状态信息推求出更多未知节点信息,从空间的角度上达到扩充信息量的目的。随着我国有关部门对供水安全保障的要求的提高,供水企业越来越多采用计算机技术对供水管网进行仿真模拟,加强有关的管网建模工作、提高供水管网的信息化管理水平,这都是供水企业建设的趋势和方向。采用EPANET2.0对城市供水管网进行建模时,能得到管网中各个节点和管网的运行情况,使管网的运行情况可视化。采用计算机技术对供水管网进行仿真模拟,成为了保障供水安全性的一个重要手段。采用CART回归树算法对管网进行状态估计,通过对管网拓扑结构中各个未知节点信息的扩充,能更加准确的对管网的运行状态进行估计。因此,供水管网水力模型的创建、状态估计工作为管[16]网日常管理工作带来了极大的方便。1.4本课题主要研究内容本文从建立中原某市实验管网的第三层模型出发,对供水管网的水力运行状态进行分析。从供水管网的水力学特性、水力条件的物理模型、供水管网状态估计分析等方面对城市供水管网系统进行研究,通过实验和软件模拟计算,提出合理的管网模型以及管网状态估计方法。论文主要研究内容如下:(1)建立供水管网水力模型本文将依据中原某市自来水厂实验管网进行建模研究,通过对管网进行现场勘察,对管网中的各个管道进行分析,得到供水管网的拓扑简图,将拓扑简图导入建模软件EPANET2.0,成功的完成了对拓扑简图的可视化工作。经过相关水4 1绪论力资料的搜集处理,输入建模软件EPANET2.0,利用一定的实验数据建立中原某市实验管网水力模型,对节点压力等相关参数进行确定。(2)管网状态估计由于监测系统安装费用过高,在供水管网中设置监测点的数据较少。以中原某市自来水厂为例,在该市共设置100多个监测点,收集的状态变量有限,无法全面反映供水管网的运行工况。通过对运行监控系统采集的状态变量进行挖掘,得到数据之间的关系,对未知节点数据进行空间上的扩充,全面掌握管网的运行工况。1.5本章小结在本章中,对课题的研究现状进行了分析,概述了本文的主要研究内容。本文主要对供水管网水力模型的建立、管网状态估计进行深入的研究。通过对本章相关问题的介绍为下文开展的工作做准备。5 华北水利水电大学硕士学位论文6 2城市供水管网水力模型的建立及应用2城市供水管网水力模型的建立及应用城市供水管网位于地下,连接复杂,在对系统进行分析和建模之前需要合理简化。在本章介绍了供水管网拓扑简化的概念以及本文研究中原模式自来水厂的实验管网系统实例。2.1城市供水管网图形简化对于城市整个管网系统来说,一般由管道、水压调节设备、水量调节设备三[17]部分组成。针对不同城市而言,由于受城市地形、城市规划、相关政策及经济发展水平的影响,供水管网的构成也不尽相同。如:对于水池来说,它的使用会对水质造成一定的影响且对水量调节能力有限,不能满足大型城市的供水;对于用水量不如大型城市的中小型城镇来说,水池的调节能力完全足够用于平衡水量、维持管网的正常运行。城市供水管网系统中的管道错综复杂的埋深于地下,其不同部分所使用的管径、材质的差别比较大,在建模上不需要考虑管网中的所有细节。在城市供水管网系统中,根据管段作用不同,可以分为:输水管、干管、支管。输水管仅具有输水作用,为水厂到管网的管段,不直接为用户供水;干管既能起到输水作用也[18]能用于配水;支管是从干管中分出的直径较小的管道。在建模工作中的供水管网是对实际管网的简化,省去了次要的、影响力较小的管段,仅保留主要的干管和支管。管网建模工作的简化方法有:省略、合并以及分解。其中,省略是对水力影响较小的管段不再考虑;合并是对部分支管的合并;分解是从主管网末端进行的。利用以上简化方法对无关管道进行处理之后,可以确定供水管网的拓扑结构简图。该简图是由点(节点)和线(管段)连接起来的抽象网络表示。管网的节点是指大用户供水点,如:机关事业单位等,节点的用水量不仅包括大用户用水量,还包含有在管段沿线配水中数量较多而分散的居民用水。其中,拓扑简图中[19]的水厂、泵站、阀门、用户等均以点的形式表示;管道是以线的形式表示。2.2城市供水管网模型的数据准备供水管网建模工作不仅要对无关管道处理得到相应的拓扑简化图,还需要有大量数据支持。实际管网的拓扑简图与完善的管网数据资料缺一不可,没有数据,建模工作难以实现相应的效果。管网数据量多、类型复杂。按照对管网数据的来源作为划分依据,拟将搜集到的相关数据分为:搜集属性数据、运行与监控数据[20]和测量数据。7 华北水利水电大学硕士学位论文管网属性数据:与管网属性相关的数据在管网建模时存有相关记录,一般情况下,可以查阅相关资料来得到相应的属性信息,属性数据一般可分为以下几种类型:(1)节点属性数据,包含有:节点编号、类型、位置、标高;(2)管段属性数据,包含有:管段编号、管段起始节点编号、管径、管长、[21]管材、敷设年代、管段摩阻系数;(3)阀门属性数据,主要包括:阀门号、各个阀门的开始节点号及终止节点号、阀门的类型记录、阀门阻力;(4)水泵属性数据,主要包括:泵号、各个水泵的开始节点号及终止节点号、泵的进出口口径、水泵的性能参数;(5)水库属性数据,包含有:相应水库编号、水库标高、水面标高、各个水库所处位置;(6)水池/水塔属性数据:水池/水塔编号、水池/水塔高程,底部标高、水[21]池/水塔位置。运行监控数据:供水管网中进行监控的主要数据是压力和流量,这两类数据通常采用SCADA系统采集的信息存入数据库中,从数据库中进行数据的传输和存储,以方便调用。供水管网的SCADA系统是实现管网远程控制的核心。主要包括以下几类:(1)管网水量运行数据:用户水表所处位置是由节点流量的空间分布决定[21]的,同时,用水量曲线由节点流量时间分布来表示;(2)水源运行数据:水源初始水位、运行过程中水源的出水压力、流量;(3)水泵运行数据:水泵开度、水泵变化曲线;(4)水库运行数据:水库水位;实测数据:主要是指在建立水力模型时,对于管网属性中一些不准确信息,需要现场再次进行勘测;实际运行的水泵曲线会随着运行时间发生变现,如果在建模时,没有准确的水泵曲线,应该进行重新测量。2.3城市供水管网水力模型计算方法分类城市供水管网水力模型的计算,可以根据对未知问题的解决方案分为流量法和水压法两类。在该种情形下,又可将相关的计算方法分为求解管段方程法、环方程法和节点方程法三种。事实上,在求解中,流量法由解环方程和管段方程组成,两种方法的区别在于环方程法在求管段流量的过程中,虚拟设置了一个中间[23]参数,在进行反复校正中得出管段流量;水压法与解节点方程法相似。(1)流量法利用方程的形式对管网模型的能量方程和连续方程进行表示,如公式(2.1):8 2城市供水管网水力模型的建立及应用qijQi0(2.1)LhH0ijkl式中:q:表示管段ij的流量;ijQ:节点i的流量;ih:从节点i到节点j管段的水头损失;ijH:两个不同节点i、j之间压力差值;由公式(2.1)可知,方程组中有相互独立的JL1(L为环数,J为节点[24]数)个等式,与未知管段数相同。(2)水压法水压法是指将某一管段的流量看作由管段的水头损失来表示。以方程来进行表示如公式(2.2):hHH(2.2)ijij式中:H、H:采用同一基准平面,计算所得管段起始节点i和管段终止节点jij的水压;h:管段i、j的水头损失;ij带入压降方程中,在该公式中,会考虑采用水头损失表示管段流量:a1qRhh(2.3)ijijijija1qR(HH)(2.4)ijijijij1n1n其中,对比于式hSq,a,则RS,将式(2.4)带入连续方程nqijQi0,则有:ja1Rijij(ij)Qi0(2.5)j9 华北水利水电大学硕士学位论文从上面的方程中可以看出,方程的个数与未知压力的方程数量一致,所以,可以每个节点的水压可以通过求解方程来计算。2.4EPANET2.0管网水力计算方法EPANET2.0是由美国环保局开发和推荐的管网水力、水质模拟软件。该软件解决了以往水力学模型运算速度慢、运算精度低的相关问题。采用计算机建成相关模型进行辅助工作时,利用EPANET2.0作为管网水力学计算的辅助性工具,[25]能很好的满足采用计算机进行建模工作的现代化需求。EPANET2.0软件采用混合节点-环方法解决了给定时间点水力状态下节点流量的连续方程和能量方程,并在采用Todini和Brameller(1987年)提出的“梯度迭代方法”的过程中使用;EPANET2.0还提供了多种方式对计算结果进行展示,如:绘制各个节点相关状态变量的时间序列图和等值线图等。假设管网中有N个连接节点和NF个已知水头节点(水库和水池),定义节点i和节点j相连的管道流量-水头损失公式为:n2HHhrQmQ(2.6)ijijijijQ2ijnhwh(r())(2.7)ij0QijDi0i1,2,...,N(2.8)jAHF(2.9)A为非零矩阵,AijPiij(j),Aiipij,利用管段水头损失公式对流量j进行求导,并进行倒数运算,得到p。将p以管段的相关形式表示为:ijij11p,p以水泵的形式表示为:p。ijn1ijij2n1nrQ||2|mQ|nrQ(/)ijijij接下来计算管网节点的校正能量。Fi(QijDi)yijpHiff(2.10)jjf10 2城市供水管网水力模型的建立及应用n2流量校正因子y相对于管道为:yprQ(||mQ||)sgn(Q);对于水ijijijijijij2n泵为yp(hrQ(/));式中sgn()x为符号函数,当x0时,该函数值ijij0ij为1,否则为-1;Q对于水泵的值总为正值。ij从以上各方程中进行求解,对校正流量进行相关的计算,得到节点的新流量为:QQ(ypH(H))(2.11)ijijijijij2.5城市供水管网水力模型实例分析2.5.1城市供水管网水力模型建立流程采取相应的简化方法对城市供水管网系统进行相应的简化,形成管网拓扑结构,导入到EPANET2.0中,并结合相关管网数据,进行管网水力模型的建立。建模流程如图2-1所示:11 华北水利水电大学硕士学位论文管段数据监测数据水泵、流量、水池、压力、阀门节点数据测量数据C值、需水量、长度、标高EPANET2.0进行建模运行图2-1城市供水管网模型建模流程图Fig2-1Flowchartofmodelmodelingforurbanwatersupplynetwork2.5.2实验管网数据收集本文以中原某市自来水厂中的实验供水管网作为建模依据,该实验供水管网共有三层,由于第一层和第二层的供水管网腐蚀严重,无法准确得到管网的摩阻系数,所以我们选取中原某市自来水公司实验供水管网的第三层管网作为建模背景。通过对中原某市自来水厂的管网系统相关数据的读取,可以得到管网的相关属性数据有:管段长度、管段直径、管段管材、铺设年代,同时也包括阀门、水表、流量计的相关位置等。节点的标高是实测数据,在这些数据的基础上,已经基本可以建立管网数字化拓扑结构。实验管网中有关运行数据主要采用人工测量读取的方式,包括:供水总管的[27]压力、流量的实时监控;管网中节点流量监控数据、压力监测点的压力等。12 2城市供水管网水力模型的建立及应用另外,阀门的开启度、水泵的开合情况等状态数据,是按照需要进行人工设置的[28]。2.5.3管网EPANET可视化建模EPANET2.0软件是美国环保局开发的计算机程序软件,主要可以对管网的水力和水质特性进行模拟,并可以对管网的拓扑简图进行相应的绘制,实现拓扑简图的可视化。管网由管道、节点、泵站、阀门和水池等主要部件构成。根据对供水管网结构图进行简化,将其在EPANET2.0中简化为由点、线组成的拓扑简图,同时,按照EPANET2.0能够识别的数据格式类型对实验管网的数据进行整理,实现拓扑简图的可视化。中原某市自来水厂实验管网第三层模型拓扑结构如图2-2所示:图2-2实验管网拓扑结构图Fig2-2Topologicalstructurediagramofpipenetwork使用EPANET2.0对供水管网进行水力计算时,不仅需要已经简化的拓扑图,[29]同时一些必要的参量也需要在管网中设置;对于本文中的实验管网,必须测量水库的供水压力和节点流量,水位的标高值一定,同时阀门的开度大小通过勘测得到,由现场测量确定的管段均采用的是PVC材质,摩阻系数为150。根据以上信息,利用水力监测点实测压力值,建立实验管网水力模型。下面对实验管网水力模型的精度进行评估,该实验管网共设有五个监测点,对12时至18时的管网运行状况进行模拟,设置实验管网水力模型模拟时间步长为15min,分为24个时段对该实验管网进行模拟计算。在图2-3~2-7中横坐标表示模拟时段,图中纵坐标表示压力值。13 华北水利水电大学硕士学位论文图2-3监测点1延时水力模拟压力情况分析图Fig2-3Theanalysischartofthepressureconditionofpoint1图2-4监测点2延时水力模拟压力情况分析图Fig2-4Theanalysischartofthepressureconditionofpoint214 2城市供水管网水力模型的建立及应用图2-5监测点3延时水力模拟压力情况分析图Fig2-5Theanalysischartofthepressureconditionofpoint3图2-6监测点4延时水力模拟压力情况分析图Fig2-6Theanalysischartofthepressureconditionofpoint415 华北水利水电大学硕士学位论文图2-7监测点5延时水力模拟压力情况分析图Fig2-7Theanalysischartofthepressureconditionofpoint5通过对上述5个监测点压力误差数据进行统计分析,得到实验管网水力模型误差情况,经过对真实测量值和模拟运算得到的压力结果进行对比,以确定模型的准确度。五个监测点统计结果见表2-1:表2-1实验管网中监测点压力误差表Table2-1Analysistableofpressureerrorofmonitoringpoint压力监测点监测点1监测点2监测点3监测点4监测点5绝对误差最大值0.00610.00290.00960.00530.0024绝对误差最小值0.00010.00000.00000.00000.0000误差极值0.00840.02150.01020.00310.0014误差中位数0.00210.00410.00320.00240.0012误差方差0.00040.00350.00050.00020.0004通过对2-1的分析观察,以及结合有关水力模型的精度标准,经过对实验管网水力的模拟,模型运行情况良好,所设置的5个监测点的模拟值与实测值之间的平均误差为0.0021MPa,模型准确度良好。16 2城市供水管网水力模型的建立及应用2.6本章小结在本章中,首先分析研究了实际供水管网的基本组成及相关结构的简化建模的方法,以中原某市自来水厂实验管网作为研究对象,利用管网相关数据,建立实验管网水力模型。根据所采集的运行与监控数据与该模型运行数据进行对比,得出建立的实验管网水力模型精度良好,平均误差为0.0021MPa,满足实验与观测要求。17 华北水利水电大学硕士学位论文18 3决策树算法基本理论3决策树算法基本理论近些年,随着大数据时代的来临,专家学者利用大数据之间蕴含的规律,获取数据的内在信息和知识。数据挖掘收到了越来越多人的关注,目前作为数据挖掘中的一大类算法—回归算法,在预测模型的建立方面起到了十分重大的作用。通过回归算法创建学习模型,针对不同的算法,将这些算法进行不同分类:基于线性模型的回归算法、基于K近邻模型的回归算法、回归算法基于树模型和其他模型(人工神经网络、支持向量机(SVN)和遗传程序设计等)的回归算[30]法。每种回归算法都有自己的特点,与其他算法相比,神经网络模型在准确度上最具优势,由于其可解释性较差,所以推广方面有些问题;从对可输入数据的类型数目来说,决策树算法占有绝对的优势地位,并且采用决策树算法生成的模型简单、可解释性强、分类精度较高,基于这些优点,在各个领域被广泛使用。在决策树生成算法中,生成树的每个节点对应于相应的样本特征,通过某种分裂准则,在决策树的叶子节点上得到我们所需要的数据。对于分类问题,生成树的叶子节点出现的结果是对分类的判断,该样本是否属于此类;对于回归树而[32]言,其叶子节点是相应的数据或者回归模型。当训练数据集过大时,建立的决策树也会变得过于复杂,从而导致可读性较差、难以理解,造成叶子节点数据读取的困难,所以考虑将决策树的生成模型转换为相应的规则,这样通过相应规则的读取得到生成模型。规则是通过“IF+分裂条件,Then+分类标签”的形式进行提取。其相对应每一条规则的创建是从决策树的根节点到叶子节点的其对应路径,对应唯一的叶子节点。在判断实例类别属性时,通过对生成规则的读取,获得类别的判断。如:R1:If分裂条件1and分裂条件3Then结果为叶子1R2:If分裂条件1and分裂条件4Then结果为叶子2R3:If分裂条件2结果为叶子3决策树算法可以进一步分类,根据需要得到输出变量的不同,该算法可以分为两类:分类树和回归树。决策树算法中,输出数据类型有两种:离散型和连续型。若要求输出结果为离散数据且为类型判断时,为分类树;若输出结果要求为[33]连续型数据且输出变量为某一具体预测数值时,为回归树。[34]ID3算法、C4.5算法以及CART算法分别为决策树的三种主流算法。其[35]中,ID3算法只能对离散型数据进行处理;C4.5是对ID3算法的改进,C4.5和CART算法均可对离散和连续型数据进行处理。在创建分类树递归的过程中,ID3算法和C4.5算法在对训练样本集进行数据挖掘时,尽可能挖掘出更多的有用信息,但是这两种算法的生成树不是二叉分支而是多叉分支,所以这两种算法的生成树比较复杂;在利用CART算法对训19 华北水利水电大学硕士学位论文练样本进行挖掘时,所得到的生成树是二叉分支。将这三种算法的生成树进行比较可以发现,CART算法得到的二叉生成树相对而言更为简单,它简化了生成树的树规模,当对生成树规则进行阅读时,也比较简单,提高了算法的效率。通过对生成树算法的学习,可以发现,生成树会出现过拟合现象,在利用生成树进行预测时,会出现一些误差。为了减少误差,进行生成树的剪枝操作,剪枝后可以[36]发现,生成树的规模变得更加简单,而且预测效果极大的提高。在采用递归算法建立回归树时,通过对样本数据的观察可以发现,数据为连续型,没有任何相关的分类标识。在这种情况下,只有根据训练数据集中相关的值来创建关于预测的规则。分类树的分类算法不同于回归树,采用最小剩余方差(SquaredResidualsMinimization)来确定最优回归树的分类,分类法则是预期在分别对最小误差方差子树划分之后,按照生成的决策树,叶子节点即为结果。在构建树的过程中,模型树使用期望误差减少值作为划分依据。CART算法主要有两[37]个步骤:决策树的生成和剪枝。模型树和CART回归树均为回归树算法。3.1分类树当决策树用于分类问题时,简称为分类树。决策树的三种主流算法均可用于分类树,唯一不同的在于分裂属性的选取。ID3算法和C4.5算法分别选用信息增益和信息增益率作为分裂特征;CART算法选用基尼指数作为分裂特征,并确定该特征的最优切分点。这里主要以CART算法为例进行信息说明。(1)相关概念基尼指数:它是一种不等性度量,是对总体包含类别混乱性的度量,总体内[38]所包含的类别越混乱,基尼指数就越大。基尼指数介于0~1之间,其中0表示在某一总体内所有种类均属于同一类,1表示在某一总体内所有种类均不属于同一类。在分类问题中,若存在一个类,则对某样本中属于第一类的概率p,因此在该类问题中对于概率分布的基尼指数定义为:KGinip()pk(1pk)(3.1)k1对于所有可能的取值a,相应的特征将数据集划分为Aa和Aa两个子集,计算集合D的基尼指数:|D||D|12GiniDA(,)GiniD()GiniD()(3.2)12|D||D|其中:GiniD():集合D的不确定性。20 3决策树算法基本理论[39]GiniAD(,):经过Aa分割后,集合D的不确定性。3.2回归树[40]对于一般线性回归,其回归算法进行的拟合模型是基于所有数据集。由于需要计算所有的样本点,且现实生活中的样本均包含有大量的特征信息,因此,使用全局建模可能会导致模型非常臃肿、建模困难。在实际应用中,数据集通常包含很多复杂的、难以理清的相互作用关系,这些相互关系使得输入变量和目标变量之间呈现非线性。对这些复杂的关系建模,易于实现的方式是使用树来对预测值进行分段,回归树是一种局部建模的方法,它仅使用局部数据对周围的复杂数据点进行建模,从而极大简化了建模的复杂度,提高了建立该模型的准确性。通过建立决策点来分割相关的有用数据,并在分割后对局部数据进行回归算法。回归树算法相对于其他的回归算法而言,可以对复杂的数据以及非线性数据进行建模。[41]回归树算法主要可以分为两类:CART回归树和模型树。回归树和模型树的主要区别在于叶子节点的数据类型,对于CART回归树而言,其叶子节点的[42]数据为一个具体的数值;对于模型树而言,其叶子节点的取值为线性回归模型。3.2.1CART回归树采用CART回归树对连续型数据进行处理时,其分裂准则是回归方差,回归方差越小,则选择其作为最优分裂点,采用该方式进行生成树的建立,预测结果就是所生成树的叶子节点的数据。如果一个给定的数据集被分成若干单位,在所分割的每个单位中均有一个确定的输出值C,这样对于该模型可以表示为:mMfx()CIxm(Rm)(3.3)m1这样对于平方误差的计算,则可以表示为该模型的输出值与测量值之间的误差:2(yifx())i(3.4)xRim由此可知,当C为所有实际值的平均值时,可以使得平方误差达到最优:mCˆaveyx(|R)(3.5)miim(1)最优切分变量和最优切分点的寻找21 华北水利水电大学硕士学位论文假设选择变量x为切分变量,该点的取值s为切分点,那么数据集可以得到j两个区域:()j()jRjs(,){|xxs},Rjs(,){|xx>s}(3.6)12寻找最优的j和s,其中cc,为区间的均值,即求解:1222min[minjs,c1(yic1)minc2(yic2)](3.7)xRjsi1(,)xRi2(,)js(2)回归树归纳算法:变量的输入:训练数据集D;结果的输出:回归树fx()对于数据集中所分割的训练数据集,对其输入空间进行二分递归分裂,得到划分的左右两个子区间,在得到的子区间中确定每个区间的输出数据,递归的构[43]建二叉回归树。①选择最优切分变量j、切分点s,对下式进行解的运算:22min[minjs,c1(yic1)minc2(yic2)](3.8)xRjsi1(,)xRi2(,)js遍历变量j,扫描固定分片变量j的切分点s,以用于选择最小值的对(,)js。②使用选定(,)js划分区域并决定相应的输出值:()j()jRjs(,){|xxs},Rjs(,){|xx>s}(3.9)121cˆmyi,xRm,m1,2(3.10)NmxRim(,)js③递归的调用①②两个步骤,直至满足停止条件。④将输入空间划分为M个区域R1,R2,....,RM,生成决策树:Mfx()cIxˆm(Rm)(3.11)m13.2.2模型树当使用回归树模型建模时,除采用CART回归树将叶子节点设置为常量值外,还有一种改进算法是将叶子节点设置为分段的线性函数。所谓分段是指模型的叶子节点是由多个线性函数段来组成的,这样的树模型被称为模型树。模型树(ModelTree),是一种多输入单输出系统的分段线性化算法,组合[44]了树结构和回归模型,即每个叶节点都是一个回归模型。也就是建立的模型22 3决策树算法基本理论树是由多个回归模型来预测,极大减少了树的规模。当使用模型树进行预测时,根据各个实例的属性来决定到达树的某个叶节点,便能用实例得到一个原始的预测值。模型树与CART回归树的区别就是在递归过程中分裂差值的计算。模型树采用期望误差减少值(SDR)作为分裂差值。在选取分裂属性时,通过对节点中每个属性进行SDR的计算,选取使得SDR值达到最大的属性作为分裂属性。|S||S|12SDRsdS()sdS()sdS()(3.12)12|S||S|其中,S1、S2是根据所选属性在节点进行分裂对应的第i个的数据集;N12sd()(x)(3.13)Nii1由上可知,模型树与CART回归树对比有以下优势:①模型树的叶子节点为多个线性函数,采用模型树做回归在理论上会比用多个平均值组成一颗回归树更具有解释性。②对于模型树中叶子节点所采用的线性模型的建立,可以极大的减小采用算法的生成树的规模,这是因为,对于回归树的叶子节点采用平均值而言,其作用范围是非常小的,对于数据的覆盖性小于线性模型,所以其规模是较模型树而言比较大。3.2.3回归树算法的步骤回归树算法一般有以下几个步骤:(1)确定目标变量:在对任何实际问题进行解决时,一定要明确研究目的,回归树算法也不例外。确定已知变量、预测变量及各个变量之间的关系,明确所需要用树回归算法的目的。(2)数据采集:确定研究目的后,收集所有与预测变量相关数据,在数据采集过程中可能会出现数据量较大的问题,对于这个问题的出现不要惊慌。因为数据量越大的数据,各个属性之间的内在特征变量越多,采用树的回归算法更能显示其对大量数据处理的优越性。(3)数据预处理:在对数据进行收集之后,原始数据可能存在一定的问题,无法达到课题对数据的要求,需要通过预处理操作使数据达到要求。主要形式有:数据清理、数据源的集成和数据形式的变换。数据清理工作的目的是不让有错误或有问题的数据进入运算过程,主要包括数据有效范围的清理、数据逻辑一致性的清理和数据质量的抽查;数据源集成是组合不同来源的数据,共享信息;数据形式的变换就是指把所搜集的数据中树回归算法无法处理的数据类型转换成所[45]能处理的数据类型,比如把离散数据进行连续化等。23 华北水利水电大学硕士学位论文(4)数据准备:将处理好的数据随机的分成训练数据集(95%)和测试数据集(5%)。(5)基于数据训练模型:根据所需要的回归树算法的理论,对处理好的数据,拟采用CART回归树算法和模型树算法建立预测模型。(6)评估模型的性能:建立了回归树模型后,需要对所建立的相关模型的数据评估,只有通过对于数据的评估才有便于判断模型。在对模型进行建立时,学习算法和测试算法所采用的的数据集是不同的,从预处理得到的数据集中分为两部分,第一部分进行建立模型,第二部分用于评估模型。本文通过对相应的评价指数和评价方法来对回归树模型进行评价。3.3CART决策树的剪枝在分析CART决策树的建树过程中,发现存在着过度拟合的问题。为了防止过拟合问题的出现,需要对生成的决策树进行剪枝。剪枝准则的确定对决策树的规模有很大的影响,对于决策树的剪枝一般使用后剪枝方法,后剪枝方法一般包括如下几种:1、错误率减低剪枝法(Reduced-ErrorPruning)修建方法考虑生成树中的所有节点作为剪枝对象,自下而上的处理节点,重复修建操作,直到验证集合精度降低为止。以下为具体实现过程:首先将以此节点作为根的子树全部删除,也就是说把这个节点由非叶子节点变成叶子节点;将该叶子节点在训练数据集中进行分类操作之后,采取验证操作;若是得到的剪枝后的树的性能不比原生成树的性能差时,可以对该节点进行删除操作。REP是最简单的后剪枝方法,在剪枝过程中,由于验证集没有涉及到生成的决策树,所以在剪枝决策树后使用该样本来对剪枝效果进行运算得到的偏差会比训练数据集有很大的提高,能够在一定程度上解决过拟合问题;然而,在测试数据集少于训练数据集的情况下,训练数据集的一些特性可能会被REP忽略,所以如果数据集较少,不太适合REP。2、代价复杂性剪枝法(Cost-ComplexityPruning)代价复杂性剪枝算法也是采用自底向上的方法,原始的生成树开始生成一个子树序列,在子树序列中通过树的真实误差来选择最佳决策树。对于误差的选择2采用标准误差,计算的复杂度为(n)。该算法时用来对子树T的成本和子树T的复杂度进行相关的定义,同时是一tt个用于测量用户代价和生成树复杂度之间的一个参数。Rt()RT()t(3.14)|N|1124 3决策树算法基本理论这里,|N|:子树T中的叶子节点数;1tRt():节点t的错误代价,公式为Rt()rt()pt(),rt()为节点t错判误差率,pt()为落入节点t的样本占所有样本的比例;RT()t:子树Tt的错误代价,公式为RT()tRi(),i为子树Tt的叶子节点。决策树的剪枝过程对于最优决策树的生成非常重要,有研究表明决策树的剪枝比生成更为重要。对于CART决策树而言,采用后剪枝方法,这也是CART决策树生成的第二个关键,剪枝算法的性能将极大的影响生成树的准确度。3.4本章小结在本章中着重对回归树算法进行了深入的研究,回归树算法主要应用在连续型数据类型中,回归树算法包括有两类:CART回归树和模型树。CART回归树和模型树的生成算法类似,区别仅在于分裂准则和叶子节点的数据类型。CART回归树的叶子节点数据模型为常数,模型树的叶子节点为线性回归模型。通过对本章相关理论的介绍为下文中利用回归树算法在城市供水管网中的应用打好了理论基础。25 华北水利水电大学硕士学位论文26 4城市供水管网状态估计研究4城市供水管网状态估计研究由于遥测系统的费用过高,在供水管网中监测点设置较少,不能有效地、全面的对管网运行状态评估,针对该问题,拟对城市供水管网系统中其他未知监测点的状态变量进行预测,从空间上进行信息量的扩增,达到对供水管网进行实时监测的目的。4.1管网状态估计方法采用数学模型对城市供水管网运行状态进行模拟。根据实测部分节点水压H(NH个)和管道流量Q(NQ个),对其他节点的水压H进行预测,以得0i0i到各节点在不同时刻水压情况。在求解过程中,已知信息为各水源的供水量以及各管段的摩阻系数。将求解步骤分为如下两步:(1)对管网中每个节点的流量进行估计,以便通过连续方程计算所测节点**的水压H及流量Q与实测值H、Q接近或相等。状态估计的目标函数为:ii0i0iNHNQ*WiI()*2Q0iQi2min()Eq2(H0iHi)WiX()()(4.1)i1H0i1Q0i节点连续方程:fHSq(,,)0(j1,2,...,JD1)(4.2)j其中:Wi():水压参数权重;IWi():流量参数权重;XH:参照水压;0Q:管网总用水量;dJD:节点总数;S:管网摩阻系数,管长、管径、粗糙率等一类函数。(2)对于各个节点的压力,均采用节点的连续型方程以及上一步估计出的节点流量得到。由此可见,关于管网中各个节点的流量称为直接计算量,这是因为管网中各个节点的流量直接估算得到的;管网中各个节点的压力是由节点流量进行估计获27 华北水利水电大学硕士学位论文取的,因此被称为间接估计量。由节点连续方程可知,该方法中需要已知管段的摩阻系数,摩阻系数会受到管道铺设年限、管道腐蚀性的影响,并非确定量,这会在一定程度上影响模型的精度。4.2回归树算法数据处理本文中的数据由中原某市自来水厂某区域中的运行监控系统中获取,选取2017年8月7日~21日连续15日的数据。在采集到的原始数据中有以下几种参数:某一时刻加压泵站出水管1的流量和压力,出水管2的流量和压力,出水管3的流量和压力,出水管4的流量和压力以及监测点5、监测点6、监测点7、监测点8、监测点9、监测点10、监测点11、监测点12监测点压力值。其中,3压力的单位为:MPa,流量的单位为m/h,监测点5因故障原因将其压力值设置为恒定,具体见附表1。该表中所有的数据均来自于中原某市自来水厂SCADA系统的数据库,数据的真实性较好。其中,选取前95%的数据为训练数据集,剩余5%为测试数据集。对于从SCADA系统的数据库中采集的数据杂乱无章,需要花费大量的时间和精力进行数据处理,以使得建模更加准确,本文拟采用数据清理的方法对原始数据进行处理。对原始数据进行清理是建模的主要部分,主要是删除与建模中无关的主题信息、冗余属性以及平滑数据中产生的噪声和空缺值的填充。有些算法自身都集成了处理噪声和缺失值的功能,但是为了建模的准确性,在这里人为的对数据问题数据进行修改。数据清理工作主要包括输入数据的核对、空值数据的替换、错误数据的处理、[46]冗余数据的消除、数据冲突的解决等。对于上述数据的不同情况,主要有三种技术方法:(1)解决不完整(缺失值)数据方法①忽略元素法。对于某一元素中的多个属性具有缺失值的情况,可以考虑使用该方法。②手动填写遗漏值。对于属性缺失值较少的问题,通过查阅相关资料,可以采用手动填写遗漏值。[47]③使用全局常量填充缺失值。在对数据进行整理时,特别是进行分类操作时,采用常数替换缺失值。如在陶帅的论文《基于决策树算法的保障房审分类规则研究》中可以发现该作者用常数0替代号牌种类中的缺失值。[48]④使用属性的平均值填充缺失值。⑤使用最有可能的取值填充缺失值。(2)处理噪声数据方法28 4城市供水管网状态估计研究①采用分箱操作处理。通过考察周围的“邻居”(即数值)以平滑存储的方法来确定这个数据的取值,它主要用于对两种技术(箱平均值和箱边界)将值存储在“桶”或“框”中。②采用聚类方式处理。通过聚类去监测离异点,利用无监督的方法对数据进行聚类操作,在聚类之外的点为离异点,主要对离异点进行处理。(2)不一致数据纠正方法通过分析数据属性间存在的相关性,用来界定完整性约束来检测不一致性,并以此改正这些不一致的数据。对原始数据的分析发现,SCADA系统监测数据存在不连续、杂乱等情况,在综合考虑相关因素后,经多方比较后,在本文中,拟选择11个主要控制参数作为样本输入,这11个参数分别为:某一时刻加压泵站出水管1的流量和压力,出水管2的流量和压力,出水管3的流量和压力,出水管4的流量和压力以及监测点6、监测点7、监测点8、监测点9以及监测点10监测点压力值;监测点11、监测点12压力值为样本的输出量。此外,对于原始数据中的缺省值,如2017年8月9日晚上7点52分44秒的数据各属性均有缺失,拟采用忽略元素法对该记录进行删除;针对2017年8月21日凌晨12点,出水管3的流量有明显的减少,但其余的监测值没有明显的变化,这里通过与相关人员联系,确定在该点并无漏损发生,仅该属性的录入值有误差,所以取该列的平均值作为该点的出水管流量。4.3回归树算法在供水管网中的应用在对原始数据进行处理后,将处理后的数据分为两部分,前95%用于模型的训练集,剩余的5%用于对模型进行测试。通过对数据的分析,可以发现该数据类型、预测数据类型均为连续型数据,选择回归树算法进行预测,通过CART回归树算法和模型树算法对的训练集的学习建立预测模型,对测试集进行预测,下面给出算法流程图,如图4-1所示。29 华北水利水电大学硕士学位论文开始数据集D叶子节点为子数据集的均叶子节点为回归系数,误差回归树or模型树值,误差平方和为方差乘以平方和为输出与输入回归值样本数差的平方和找出最优切分点最优切分点是否满足停止条件得到最优二分特征和特征值根据最优切分点切分数据集得到左右子树集图4-1回归树算法流程图Fig4-1Flowchartofregressiontreealgorithm4.3.1CART回归树在供水管网中的应用本文取自中原某市某区域中自来水厂的运行与监测系统,所用的变量为某一时刻加压泵站出水管1的流量和压力,出水管2流量、压力,出水管3的流量和压力,出水管4的流量和压力以及监测点6、7、8、9、10的压力值;监测点11、监测点12的压力值为样本的输出量。拟对以上数据用CART回归树算法进行统计分析,期望选出比较合理的关于监测点11、监测点12的压力预测值。在本文中选取R语言建立CART回归树。R语言是一种开源、免费、功能非常强大的数据解析软件,可用于统计分析、绘图的优秀工具,在统计学中很多30 4城市供水管网状态估计研究[49]前沿的方法都能利用R语言以最快的效率在计算机中得到相应的结果,根据[50]以上原理,应用R语言生成CART回归树,并对生成的结果数据进行分析。在CART回归树中,为了成功的构建以分段常数为叶节点的树,需要度量出数据的一致性。在连续型数据中,选择按某一特征划分前后标签数据总差值来计算混乱度,每次均选取使数据总差值最小的那个特征作为最佳分类特征,差值越小,相似度越高,数据的一致性越高。选取方差做差值,回归方差的计算公式为:222(xi)xin(4.3)iIiI在CART回归树中,每次最佳分支特征的选择过程:①先令最佳方差为无限大bestVarinf。②依次计算根据特征划分后数据后的总方差currentVar,如果currentVarbestVar,则bestVarcurrentVar。③返回最佳分支特征、分支特征值,左右分支子数据集。通过对R语言的学习可知,rpart包是用来实现递归分割和回归树的,因此本文采用R语言的rpart包进行下一步的研究。rpart包中所包含的函数比较少,主要有两个功能,第一个功能主要用于树模型的拟合;第二个功能是用于根据“成本复杂性”进行剪枝操作。这两个功能分别对应于包中两个函数rpart()和prune()。图4-2为监测点11的生成树,图4-3为监测点12的生成树。31 华北水利水电大学硕士学位论文0.35100%RTU9<0.38YesNo0.340.3640%60%RTU9<0.37RTU9<0.390.320.350.360.3816%24%47%13%pressure2<0.32RTU10<0.3Pressure3<0.360.300.334%12%0.350.370.370.3810%37%3%10%pressure4<0.34RTU6<0.290.320.330.360.385%7%26%11%RTU7<0.300.340.364%22%图4-2监测点11原始回归树Fig4-2OriginalregressiontreeRTU1132 4城市供水管网状态估计研究0.27100%Yespressure2<0.38No0.260.2832%68%RTU7>=0.31RTU9>=0.40.250.260.270.2825%7%20%48%RTU6<0.29pressure3<0.36RTU9<0.380.240.250.260.270.270.2819%6%4%16%8%40%pressure4<0.34pressure1>=0.32RTU8<0.330.230.240.260.270.270.287%12%2%14%8%32%图4-3监测点12原始回归树Fig4-3OriginalregressiontreeRTU12从以上两图,可以看出每次分裂的节点,以及节点中样本的大小,预测结果等信息等。当回归树划分过细时,会产生过拟合现象,不能反映数据内在的规律,在实际中对于该树的创建没有任何意义;如果生成树的枝节太少,也必然会有一定程度的预测误差。由此看来,要同时考虑到树的规模和误差的大小这两个因素,所以通常采用一个叫“成本复杂性”的标准对树进行限制,最后达到的目的是使误差和树的规模都尽可能的小。本文采用代价复杂性剪枝算法,误差的计算采用1-SE(1标准差)规则。误差是通过交叉验证获得的,在保证误差相对较小的情况下,选取尽量小的复杂性参量,依照该参量进行剪枝,使生成的规则兼具树的规模和误差范围。表4-1、4-2分别为监测点11原始生成树和监测点12原始生成树的复杂性参量表。其中,[51]xerror是通过交叉验证获得的模型误差,xstd为模型误差的标准差。33 华北水利水电大学硕士学位论文表4-1监测点11原始树复杂性参量表Table4-1Theoriginaltree’sparameterofRTU11nsplitCPrealerrorxerrorxstd10.6020401.000001.051820.1372120.1524710.397950.425120.0466330.1123720.245230.396870.0512740.1354630.345610.423810.0425650.0100040.090310.169270.0351360.0104550.104540.120530.0412170.0141560.104480.198710.0367180.1283270.256411.034180.0741290.0204680.132840.200510.03831100.1204390.284430.324450.05122表4-2监测点12原始树复杂性参量表Table4-2Theoriginaltree’sparameterofRTU12nsplitCPrealerrorxerrorxstd10.4103101.020030.200310.1101820.0353110.589680.741230.1292130.0246320.554380.766980.1366840.0100030.507810.843230.1540750.0143240.432150.825160.1560260.0162450.542870.765410.1549270.0268460.352870.623170.2146880.0219470.529750.782620.1422890.1204580.245681.034810.19345从以上两图中不难发现:分别选取CP=0.0142,CP=0.13531作为修剪值,修剪后的监测点11剪枝树、监测点12剪枝树分别如图4-6、4-7所示。34 4城市供水管网状态估计研究0.35100%YESRTU9<0.38NO0.340.3640%60%RTU9<0.37RTU9<0.390.3647%RTU10<0.30.3631%RTU6<0.290.330.350.350.360.370.353814%26%16%21%10%10013%%图4-6监测点11剪枝树Fig4-6PruningtreeRTU110.27100%YESpressure2<0.32NO0.250.2834%68%RTU7>=0.31RTU9>=0.40.2860%RTU9<0.380.240.260.270.270.2818%14%8%19%41%图4-7监测点12剪枝树Fig4-7PruningtreeRTU1235 华北水利水电大学硕士学位论文通过图4-2、4-3、4-6及4-7的分析可知,监测点11、监测点12的叶子节点为均值,百分比为所出现的概率,按照IF-ELSE规则,可分别提取出监测点11和监测点12的生成规则,这里RTU6、RTU7、RTU8、RTU9、RTU10表示监测点6、7、8、9、10的压力监测点11剪枝前的生成规则:(1)IFRTU90.37andpressure20.32THENRTU11=0.30(2)IFRTU90.37andpressure20.32andpressure40.34THENRTU11=0.32(3)IFRTU90.37andpressure20.32andpressure40.34THENRTU11=0.33(4)IF0.37RTU90.38THENRTU11=0.35(5)IF0.38RTU90.39andRTU100.3THENRTU11=0.35(6)IF0.38RTU90.39andRTU100.3andRTU60.29andRTU70.30THENRTU11=0.34(7)IF0.38RTU90.39andRTU100.3andRTU60.29andRTU70.30THENRTU11=0.36(8)IF0.38RTU90.39andRTU100.3andRTU60.29andTHENRTU11=0.38(9)IFRTU90.39andpressure30.36THENRTU11=0.37(10)IFRTU90.39andpressure30.36THENRTU11=0.38监测点11剪枝后的生成规则:(1)IFRTU90.37THENRTU110.33(2)IF0.37RTU90.38THENRTU110.35(3)IFRTU90.39THENRTU110.3836 4城市供水管网状态估计研究(4)IF0.38RTU90.39andRTU100.3THENRTU110.35(5)IF0.38RTU90.39andRTU100.3andRTU60.29THENRTU110.36(6)IF0.38RTU90.39andRTU100.3andRTU60.29THENRTU110.37监测点12剪枝前生成规则:(1)IFpressure20.38andRTU70.31andRTU60.29andpressure40.34THENRTU12=0.23(2)IFpressure20.38andRTU70.31andRTU60.29andpressure40.34THENRTU12=0.24(3)IFpressure20.38andRTU70.31andRTU60.29THENRTU12=0.25(4)IFpressure20.38andRTU70.31andRTU60.29THENRTU12=0.26(5)IFpressure20.38andpressure30.36THENRTU12=0.26(6)IFpressure20.38andRTU90.4andpressure30.36andRTU80.33THENRTU12=0.26(7)IFpressure20.38andRTU90.4andpressure30.36andRTU80.33THENRTU12=0.27(8)IFpressure20.38andRTU90.38THENRTU12=0.27(9)IFpressure20.38and0.38RTU90.4andpressure10.32THENRTU12=0.27(10)IFpressure20.38and0.38RTU90.4andpressure10.32THENRTU12=0.28监测点12剪枝后生成规则:(1)IFpressure20.32andRTU70.31THENRTU120.2637 华北水利水电大学硕士学位论文(2)IFpressure20.32andRTU70.31THENRTU120.24(3)IFpressure20.32andRTU90.4THENRTU120.27(4)IFpressure20.32andRTU90.38THENRTU120.27(5)IFpressure20.32and0.38RTU90.4THENRTU120.28根据以上生成规则,可以得到监测点11、监测点12在剪枝前后的值及其误差,如图。经过多次试验,截取部分数据可知,在未剪枝前模型的预测能力较差,剪枝后,模型的相对误差控制在5%以内,表4-3、4-4所示。表4-3监测点11预测值及其误差Table4-3ThepredictvalueanderrorofRTU11监测点11剪枝前预剪枝后预测量值剪枝前相剪枝后相测值测值对误差对误差960.302640.346290.3453812.372780.26437970.356660.375780.367312.899542.30984980.385620.354140.359817.175111.57448990.364290.346280.341626.636911.364961000.365540.330990.337518.308791.92734表4-4监测点12预测值及其误差Table4-4ThepredictvalueanderrorofRTU12监测点12剪枝前预剪枝后预测量值剪枝前相剪枝后相测值测值对误差对误差960.346280.276180.2741226.3240.75126970.375790.276180.2784334.96610.80919980.354180.273340.2733727.5641.02768990.346280.276180.2752525.8080.339481000.330950.256240.2752620.2526.906314.3.2模型树算法在供水管网中的应用当使用模型树来对一个测试实例进行数据预测时,在每个节点处根据测试实例的属性来决定其在模型树中的走向,直至到达叶子节点,叶子节点处含有一个基于部分属性值的线性模型,这样便能通过一个测试实例得到一个原始的预测值。38 4城市供水管网状态估计研究该样本取自中原某市自来水厂的运行与监测系统,共采集了100条数据,由于模型树建模只能预测单个变量,对多个变量无法进行预测,所以,对于监测点11、监测点12的压力值进行分别预测。在对监测点11的压力值进行预测时,输入变量为某一时刻加压泵站出水管1的流量和压力,出水管2的流量和压力,出水管3的流量和压力,出水管4的流量和压力以及监测点6、7、8、9、10、12监测点压力值。与监测点11的预测方法类似,在对监测点12进行预测时,输入变量为某一时刻加压泵站出水管1的流量和压力,出水管2的流量和压力,出水管3的流量和压力,出水管4的流量和压力以及监测点6、7、8、9、10、11监测点压力值。Weka是基于Java的一种数据挖掘工具,简单、使用门槛低。导入预处理后的数据,选择classify中M5的classifier,选择目标属性,点击start就可以对导入数据进行训练得到模型树,如图4-8所示。图4-8Weka实现模型树算法Fig4-8Wekaimplementationmodeltreealgorithm利用Weka对监测点11、监测点12分别进行建模,得到相应的生成树及规[52]则,如图4-9、4-10所示,这里RTU6、RTU7、RTU8、RTU9、RTU10表示监测点6、7、8、9、10的压力。39 华北水利水电大学硕士学位论文图4-9算法实现监测点11生成树Fig4-9ImplementationofRTU11spanningtreebyalgorithm监测点11生成规则:IFRTU9>0.377THENRTU11=0.3338*pressure1-0.0573*pressure3-0.1248*RTU8+0.601*RTU9+0.0621IF0.3651656THENRTU11=0.1083*RTU8+0.2586*RTU10+0.2047IFRTU9<=0.365anddischarge4<=1656THENRTU11=0.4809*pressure140 4城市供水管网状态估计研究图4-10算法实现监测点12生成树Fig4-10ImplementationofRTU12spanningtreebyalgorithm监测点12的生成规则:IFpressure2>0.3156THENRTU12=0.3078*RTU7-0.1248*RTU8+0.2015*RTU9+0.601*pressure2+0.1253IFpressure2>0.2803THEN监测点12=-0.1172*RTU6-0.0353*RTU7+0.1687*RTU8+0.2027*RTU10+0.169967IFpressure2<=0.2803anddischarge2>1464THEN监测点12=-0.2285*RTU8+0.5555*RTU10+0.1847IFpressure2<=0.2803anddischarge2<=1464THEN监测点12=-0.1563*RTU7+0.03587*RTU8-0.02169*RTU10+0.358441 华北水利水电大学硕士学位论文表4-5监测点11压力预测值及其误差Table4-5modeltree’spredictionvalueanderrorofRTU11监测点11模型树预测值真实值相对误差960.365320.345375.77629970.326240.3673111.1856980.386320.359817.36827990.368510.341627.873641000.325460.337513.56462表4-6监测点12压力预测值及其误差Table4-6modeltree’spredictionvalueanderrorofRTU12监测点12模型树预测值真实值相对误差960.285620.274154.19148970.296340.278436.43274980.296870.273378.59487990.255490.275267.175761000.275640.275250.142154.4回归树算法实验结果分析对训练数据采用CART回归树算法进行预测模型的构建,建立CART回归树预测模型对监测点11、监测点12的压力值进行预测。在剪枝前,真实值与预测值的相对误差较大,利用标准差对原始树进行剪枝后,真实值与预测值的相对误差明显减少,保持在5%以内。对训练数据采用模型树算法进行预测模型的构建,建立模型树预测模型分别对监测点11、监测点12的压力值进行预测。模型树的叶子节点是线性模型,其生成规则较简单。通过对真实值和预测值的相对误差保持在10%以内。通过对两种预测模型的对比,CART回归树预测模型可以对单个或多个变量进行预测,模型树建立的模型只能对单个变量进行预测。CART回归树预测模型的压力预测值在准确度方面高于模型树的压力预测值。4.5本章小结在本章中采用CART回归树算法和模型树算法分别对城市供水管网中未知监测点压力值的预测,推求出管网中未知节点的状态变量,更好的反应管网的运行状态。采用CART回归树算法和模型树算法对监测点11、监测点12的压力值42 4城市供水管网状态估计研究进行预测,通过预测值与真实值对比可得,CART回归树算法的相对误差保持在5%以内,模型树算法的相对误差保持在10%以内。在预测准确度方面,CART回归树算法高于模型树算法。43 华北水利水电大学硕士学位论文44 5总结与展望5总结与展望本文开展了对供水管网建模和状态估计的研究:首先对中原某市自来水厂实验区域进行水力建模分析,其次利用回归树模型对城市供水管网运行状态进行模拟,建立了基于CART回归树、模型树的预测模型,并进行相关的状态估计工作。现将本文主要工作及结论总结如下:1、利用EPANET2.0建立了较准确的实验区域管网水力模型。分析该管网模型水力模拟压力监测点数据情况,可知模型能较准确的拟合实验管网水力运行情况,压力模拟值与测量值的平均误差在0.0021MPa,在实验误差范围内。2、采用CART回归树算法和模型树算法分别对训练数据进行预测模型,通过对结果的分析,真实值与预测值的相对误差保持在5%以内,预测结果较为准确。通过对未知节点状态变量的预测,扩大管网的运行数据量,更好的反应出管网的运行状态。论文在城市供水管网的建模、状态模拟及预测方面取得了一些结论,但仍有不足,研究工作可进一步深入:1、文中建立的水力学建模仅考虑了该实验区域的测量数据,实验区域管道的摩阻系数等数据较为稳定,在城市供水管道易出现管道腐蚀等现象,因此在建立模型时,为保证水力模型的准确度,后续可考虑对水力模型进行校核,避免管道腐蚀对结果的影响。2、文中状态评估模型主要考虑实时模拟监测,与SCADA系统结合。利用CART回归树算法,通过SCADA系统的已知状态变量对未知节点的状态变量进行预测,扩大未知节点的状态变量,对管网的运行进行状态估计。后续可将地理信息系统、EPANET可视化模型、状态估计模型相结合,对未知节点信息量的扩充,根据各个节点压强的变化,进行漏损定位研究。45 华北水利水电大学硕士学位论文46 致谢致谢时光飞逝,转眼间毕业即将到来,我的学习生涯也将告一段落,回顾这三年的研究生生活,感受颇深,收获也颇多。在毕业来临及论文完成之际,我想向这三年里给予我莫大帮助和支持的人们表达我最真挚的感谢。首先,我要感谢我的导师刘建华教授,校外导师平源教授。感谢刘老师和平老师在这三年里无论是学习还是生活上给予我的无限帮助。特别是刘老师,在校期间跟刘老师相处时间较多,对于生活和学习中的问题,他都能给予我最好的解决问题的思路。“学会发现问题、分析问题、解决问题”,是我从刘老师身上学习的思想,在未来的生活和工作中,我将牢牢谨记,能够师从刘老师是我至高的荣尚。所以,在此再次感谢刘老师、平老师在这三年里对我的关怀和谆谆教导。其次,我要感谢在论文完成过程中对我帮助的邱同学及中原某市自来水公司的高工们。在实验过程中,有了高工们的指导和邱同学的帮助才能顺利完成。再次,感谢这三年研究生生涯中帮助过我的信工学院老师和同学们,正是有了学院老师们这三年来对我的指导和帮助,让我的专业技能得到了提升,对于生活和工作的态度有了全新的认识;寝室姐妹和实验室伙伴更是我学业的忠实陪伴者,由于他们的存在,使得学习氛围变得轻松自在,使得自己能够以一种轻松愉悦的学习状态去完成研究生三年的学习生活,愿我们扬帆起航,有美好的明天。同时,还要感谢一直给予我关心和支持的家人和朋友们,谢谢他们不断的给予我的关心和鼓励,正是这些无微不至的关心和鼓励,我才能克服种种困难,拥有现在的生活。最后,我在此真挚的感谢养育我三年的母校,谢谢母校给了我一个宽阔优越的学习生活环境,使我得以不断提升自己、快速成长。47 华北水利水电大学硕士学位论文48 参考文献参考文献[1]孙柏.供水管网水力水质模型及其校核研究[D].湖南大学,2012.[2]朱伟斌.基于CDMA的城市燃气配送管网监控系统设计[D].杭州电子科技大学,2014.[3]李霞.城市供水管网漏损定位及控制研究[D].天津大学,2006.[4]王丽爱.小麦主要生育期苗情诊断关键参数遥感监测算法优化研究[D].扬州大学,2016.[5]张辰光.铁路供水管网在线监测系统的研究[D].西南交通大学,2015.[6]罗富敏.基于PSO--ACO融合优化算法的供水管网污染源定位研究[D].广东工业大学,2016.[7]蔡华强.城市供水管网DMA实时建模及应用研究[D].杭州电子科技大学,2016.[8]徐良,李杰.供水管网抗震拓扑优化算法研究[J].中国科学:技术科学,2012(11):1351-1360.[9]孙晨刚.供水管网水力模型系统在特大型城市供水调度中的应用[J].净水技[10]SiewC,TanyimbohTT,SeyoumAG.AssessmentofPenalty-FreeMulti-ObjectiveEvolutionaryOptimizationApproachfortheDesignandRehabilitationofWaterDistributionSystems[J].WaterResourcesManagement,2014,28(2):373-389.[11]LeaR.BP,CorporateR&D,andtheUniversity[J].Academe,2010,96(6):20-21.[12]张雄.西安市供水管网决策支持系统研究[D].西安理工大学,2007.[13]邰明明.基于地统计的给水管网状态分析方法研究[D].重庆大学,2013.[14]袁圃.基于改进的GA优化BP-NN在电网故障区域诊断中的研究[D].昆明理工大学,2016.[15]向高.基于免疫算法的供水系统优化调度研究[D].哈尔滨工业大学,2007.[16]叶佳琪.供水管网水力水质的模拟研究[D].重庆大学,2016.[17]王妍.油田注水生产预测仿真研究[D].大庆石油学院,2004.[18]苗涛田.三亚市供水管网系统分析研究[D].河北工程大学,2013.[19]WangHW,ZhangLC,ZhangHD,etal.ResearchandDevelopmentontheFrameofArcGISServer[J].[20]孙海.洪水演进仿真综合模型研究与应用[D].华中科技大学,2009.[21]王珍珍.大型水电站厂内经济运行决策支持系统研究与实现[D].华中科技大学,2011.[22]贺忆.给水管网直接优化设计方法研究[D].合肥工业大学,2013.49 华北水利水电大学硕士学位论文[23]郭东东.基于反分析理论的给水管网有效管径计算方法研究[D].西南交通大学,2016.[24]MurrayAT.GISandMulticriteriaDecisionAnalysis(review)[J].GeographicalAnalysis,2002,34(1):91-92.[25]沈建奇.盾构掘进过程数值模拟方法研究及应用[D].上海交通大学,2009.[26]祁司亮.面向管网安全运行与节能降耗的水箱式二次供水运行优化[J].环境水质学国家重点实验室,2013.[27]殷梦鑫.多水站监控系统的研究与应用[D].西安科技大学,2013.[28]盛泽斌.城市供水管网漏失智能分析定位技术研究[D].青岛理工大学,2012.[29]张颖.供水泵房优化运行设计及其程序的编制[D].合肥工业大学,2006.[30]孙鑫.基于LS_SVM建立发酵过程动态模型及其参数优化[D].北京工业大学,2013.[31]许行.基于决策树的单调分类算法研究[D].山西大学,2014.[32]DobbertinM,BigingGS.Usingthenon-parametricclassifierCARTtomodelforesttreemortality.[J].ForestScience,1998,44(4):507-516.[33]陶双红.决策树关联规则算法在高校贫困生评定管理中的应用[D].湖南大学,2013.[34]BashirS,QamarU,KhanFH,etal.AnEfficientRule-BasedClassificationofDiabetesUsingID3,C4.5,&CARTEnsembles[C]//InternationalConferenceonFrontiersofInformationTechnology.IEEE,2015:226-231.[35]TureM,TokatliF,KurtI.UsingKaplan–Meieranalysistogetherwithdecisiontreemethods(C&RT,CHAID,QUEST,C4.5andID3)indeterminingrecurrence-freesurvivalofbreastcancerpatients[J].ExpertSystemswithApplications,2009,36(2):2017-2026.[36]CharoenpornP.ReservoirinflowforecastingusingID3andC4.5decisiontreemodel[C]//IEEEInternationalConferenceonControlScienceandSystemsEngineering.IEEE,2017.[37]张蓓蕾.CART算法在学生成绩分析中的应用研究[D].安徽大学,2009.[38]ZollingerJM,DevineJ.Distributingdatabasedifferencescorrespondingtodatabasechangeeventsmadetoadatabasetablelocatedonaservercomputer:US,US5999947A[P].1999.[39]WitloxF.GiniCoefficient[M]//TheInternationalEncyclopediaofGeography.JohnWiley&Sons,Ltd,2017.[40]成志鹏.基于物联网的无线传感器网络中压缩感知研究[J].2017.50 参考文献[41]秦艳荣.基于智能移动终端的恶意应用检测研究[D].东南大学,2016.[42]FuCY.Combiningloglinearmodelwithclassificationandregressiontree(CART):anapplicationtobirthdata[J].ComputationalStatistics&DataAnalysis,2004,45(4):865-874.[43]HarrisNR,TudorMJ,WhiteNM,etal.Electromagneticdeviceforconvertingmechinalvibrationalenergyintoelectricalenergy,andmanufacturethereof:US,US20070007827[P].2007.[44]JungM,ReichsteinM,BondeauA.TowardsglobalempiricalupscalingofFLUXNETeddycovarianceobservations:Validationofamodeltreeensembleapproachusingabiospheremodel[J].Biogeosciences,2009,6(10):2001-2013.[45]李萌.基于粗集理论的数据挖掘的数据预处理研究[D].华中师范大学,2004.[46]李莹.面向风险基础审计的计算机报表审计系统及实现[D].西安交通大学,2002.[47]刘志鹏.移动通信数据挖掘关键应用技术研究[D].南京航空航天大学,2015.[48]李艳.基于改进的K-均值算法的朴素贝叶斯分类及应用[D].合肥工业大学,2007.[49]吴冬梅.如何在计算机R语言教学中实现数据可视化的应用研究[J].数码世界,2017(5):191-191.[50]AnspachSS,WestJ,HeyligerB,etal.Standardtelephoneequipment(STE)baseddeployablesecurecellularcommunicationsystem:US,US20070177578A1[P].2007.[51]徐浩凯.东北林区主要阔叶材密度近红外定标模型研究[D].东北林业大学,2015.[52]LawrenceRL.Rule-BasedClassificationSystemsUsingClassificationandRegressionTree(CART)Analysis[J].SfbDiscussionPapers,2001,22(1):281-304.51 华北水利水电大学硕士学位论文52 附表附表表A:水厂供水信息(流量:立方米/小时;压强:MPa)出水管1出水管1出水管2出水管2出水管3出水管3出水管4出水管4时间流量压力流量压力流量压力流量压力2017/8/73408.00.28001200.00.27502512.00.31901184.00.29103:23AM2017/8/75088.00.33803584.00.33304064.00.37902416.00.34106:47AM2017/8/74736.00.34802864.00.34303808.00.38602560.00.356010:10AM2017/8/74160.00.33902928.00.33403600.00.37802352.00.34801:34PM2017/8/73472.00.33903184.00.33503424.00.37802192.00.35104:58PM2017/8/75568.00.34803360.00.34304320.00.38702800.00.35608:21PM2017/8/74800.00.29901464.00.29503216.00.33901840.00.309011:45PM2017/8/83488.00.27901136.00.27502432.00.31901056.00.29003:09AM2017/8/84736.00.32603408.00.31503616.00.35802064.00.33006:32AM2017/8/84640.00.34803120.00.34403856.00.38602432.00.35709:56AM2017/8/84896.00.34802912.00.34303824.00.38702416.00.35601:20PM2017/8/84016.00.33803024.00.33403664.00.37802192.00.34804:43PM2017/8/85152.00.34803120.00.34304096.00.38602640.00.35508:07PM2017/8/85280.00.30701288.00.30203456.00.34402112.00.318053 华北水利水电大学硕士学位论文11:30PM2017/8/93888.00.27901136.00.27502656.00.31901152.00.29202:54AM2017/8/94448.00.30803216.00.30403536.00.34801992.00.31906:18AM2017/8/95344.00.35703136.00.35304160.00.39602624.00.36409:41AM2017/8/94960.00.34702944.00.34403904.00.38702368.00.35601:05PM2017/8/94288.00.33803408.00.33403792.00.37702336.00.34804:29PM2017/8/92448.00.32004576.00.31603664.00.35902352.00.329011:16PM2017/8/103616.00.27901360.00.27502592.00.31901168.00.29102:40AM2017/8/104288.00.31701840.00.26903184.00.31301600.00.28506:03AM2017/8/105536.00.35703312.00.35304288.00.39502720.00.36409:27AM2017/8/104640.00.33803488.00.33403856.00.37702352.00.35004:14PM2017/8/105344.00.34703120.00.34304160.00.38602624.00.35507:38PM2017/8/104704.00.32803296.00.32404000.00.36602528.00.337011:01PM2017/8/114256.00.2790992.00.27502800.00.31901360.00.29102:25AM2017/8/115024.00.28901600.00.28603184.00.32901624.00.30305:49AM2017/8/115696.00.35803616.00.35404416.00.39702768.00.36609:12AM2017/8/115120.00.34903328.00.34404128.00.38802512.00.357012:36PM54 附表2017/8/114768.00.34002848.00.33403824.00.37802272.00.34904:00PM2017/8/114832.00.34803392.00.34404096.00.38802528.00.35507:23PM2017/8/115568.00.33903120.00.33304224.00.37702688.00.346010:47PM2017/8/124576.00.2780948.00.27402896.00.31901544.00.29002:10AM2017/8/124960.00.27601120.00.27102976.00.31501584.00.29005:34AM2017/8/125920.00.35103264.00.34504384.00.38902848.00.35908:58AM2017/8/124768.00.34803136.00.34303920.00.38702496.00.355012:21PM2017/8/123648.00.33903312.00.33403584.00.37702192.00.34703:45PM2017/8/125120.00.34702976.00.34303984.00.38602512.00.35407:09PM2017/8/125504.00.34603168.00.34304224.00.38502688.00.353010:32PM2017/8/134352.00.27901056.00.27502784.00.31801360.00.29101:56AM2017/8/134736.00.27801264.00.27402752.00.31901280.00.29005:20AM2017/8/135696.00.35703216.00.35204320.00.39502832.00.36308:43AM2017/8/134800.00.34702976.00.34303936.00.38602512.00.355012:07PM2017/8/134128.00.33803440.00.33403776.00.37802272.00.34703:30PM2017/8/135344.00.34703216.00.34304096.00.38602592.00.35506:54PM2017/8/136016.00.34803504.00.34304608.00.38602960.00.356010:18PM55 华北水利水电大学硕士学位论文2017/8/144800.00.27901064.00.27403008.00.31901384.00.29101:41AM2017/8/144384.00.27801176.00.27502784.00.31801152.00.29205:05AM2017/8/145504.00.35703056.00.35304256.00.39502656.00.36308:29AM2017/8/144800.00.34802976.00.34303952.00.38602496.00.355011:52AM2017/8/144080.00.33803408.00.33403728.00.37802272.00.34803:16PM2017/8/144320.00.33903616.00.33404000.00.37702416.00.34706:40PM2017/8/145696.00.35604192.00.35104704.00.39403168.00.364010:03PM2017/8/154512.00.27801696.00.27403056.00.31801688.00.29101:27AM2017/8/154160.00.27901328.00.27502720.00.31901376.00.29104:50AM2017/8/155664.00.35703504.00.35204384.00.39502864.00.36408:14AM2017/8/155280.00.34703008.00.34304080.00.38602480.00.356011:38AM2017/8/154832.00.33802640.00.33303696.00.37802160.00.34603:01PM2017/8/155312.00.33702992.00.33204000.00.37702416.00.34606:25PM2017/8/155600.00.35704544.00.35304704.00.39403040.00.36509:49PM2017/8/164608.00.2790992.00.27502880.00.31901432.00.29101:12AM2017/8/164080.00.27901240.00.27502640.00.31901104.00.29104:36AM2017/8/165824.00.35603600.00.35204480.00.39402784.00.363056 附表8:00AM2017/8/164864.00.34803264.00.34304016.00.38602512.00.356011:23AM2017/8/163840.00.33903328.00.33403600.00.37802240.00.34802:47PM2017/8/164384.00.33903600.00.33403936.00.37702480.00.34706:10PM2017/8/165664.00.35604512.00.35304800.00.39403056.00.36409:34PM2017/8/174544.00.2790876.00.27502880.00.31801608.00.290012:58AM2017/8/173920.00.27901184.00.27502624.00.31901224.00.29104:21AM2017/8/176304.00.34803696.00.34404512.00.38702816.00.35907:45AM2017/8/174800.00.34803440.00.34404080.00.38702432.00.356011:09AM2017/8/174608.00.33902608.00.33403632.00.37802256.00.34702:32PM2017/8/175152.00.33702608.00.33203888.00.37602416.00.34605:56PM2017/8/175440.00.35704704.00.35204800.00.39403216.00.36409:20PM2017/8/184768.00.27201136.00.26703104.00.31201752.00.283012:43AM2017/8/184192.00.27901440.00.27502704.00.31901240.00.29104:07AM2017/8/186048.00.35503168.00.34704320.00.39002688.00.36207:30AM2017/8/184992.00.34703008.00.34303984.00.38602448.00.356010:54AM2017/8/184512.00.33802976.00.33403776.00.37702240.00.34702:18PM57 华北水利水电大学硕士学位论文2017/8/185792.00.35703456.00.35204384.00.39402864.00.36309:05PM2017/8/194352.00.28901240.00.28502992.00.32801776.00.300012:29AM2017/8/194048.00.27901208.00.27502592.00.31901264.00.29103:52AM2017/8/195664.00.35703344.00.35204128.00.39602480.00.36407:16AM2017/8/194640.00.34703280.00.34404016.00.38602480.00.356010:40AM2017/8/194160.00.33903456.00.33503824.00.37802320.00.34802:03PM2017/8/195568.00.35703344.00.35204352.00.39602816.00.36108:50PM2017/8/204512.00.28901368.00.28503120.00.32801848.00.301012:14AM2017/8/203936.00.27901152.00.27502592.00.31901216.00.29103:38AM2017/8/205056.00.34703792.00.34403952.00.38602448.00.36607:01AM2017/8/205504.00.34603360.00.34304352.00.38502784.00.355010:25AM2017/8/204064.00.33903648.00.33503744.00.37802304.00.34801:49PM2017/8/204128.00.33903744.00.33404128.00.37801280.00.34905:12PM2017/8/206048.00.35703648.00.35304896.00.39501488.00.36508:36PM2017/8/215920.00.29802832.00.295012.00.34001216.00.310012:00AM58 附表表B:同一时刻各监测点的压强值(单位:MPa)监测点监测点监测点时间监测点6监测点7监测点8监测点91011122017/8/70.31270.32250.36260.38720.26120.36040.23933:23AM2017/8/70.28410.29760.32530.37610.28990.34430.24026:47AM2017/8/70.29760.30980.35250.39600.30680.37780.240210:10AM2017/8/70.30390.31650.35010.39690.30190.37840.29031:34PM2017/8/70.30210.30430.35420.40440.30540.38180.29034:58PM2017/8/70.25840.28430.31580.37370.29530.34590.29038:21PM2017/8/70.29810.31730.35100.37710.27490.35190.246711:45PM2017/8/80.31480.32610.37050.38830.26330.36150.23893:09AM2017/8/80.27820.27900.33960.38010.28350.35040.26066:32AM2017/8/80.30710.32850.35180.39230.31290.37610.28719:56AM2017/8/80.29830.30660.34730.40200.31130.37290.28841:20PM2017/8/80.28560.27940.34370.39390.30260.37880.28374:43PM2017/8/80.27900.30060.33210.38550.30360.36280.28378:07PM2017/8/80.27940.30260.34460.38060.27770.35790.254211:30PM2017/8/90.31240.32160.35640.37890.26570.35190.23662:54AM2017/8/90.28240.29460.33830.37200.27170.34840.248859 华北水利水电大学硕士学位论文6:18AM2017/8/90.28860.30750.33470.38870.31580.36880.28419:41AM2017/8/90.29400.30360.32980.38380.30240.36560.27921:05PM2017/8/90.28910.28990.32830.37860.29870.36060.28504:29PM2017/8/90.28990.31630.34460.38480.28410.36040.285011:16PM2017/8/100.31350.32360.35910.38060.26570.35360.28502:40AM2017/8/100.29940.30040.34540.35680.28560.35180.25996:03AM2017/8/100.28930.30540.32760.37820.30430.35850.28469:27AM2017/8/100.28740.29120.32870.37910.29610.35980.27844:14PM2017/8/100.27300.28560.32080.37930.29890.35760.27847:38PM2017/8/100.27300.30060.32870.37410.28200.34690.278411:01PM2017/8/110.29440.29480.34780.37440.25460.34290.27842:25AM2017/8/110.29460.30150.33320.36210.25930.33260.27845:49AM2017/8/110.28220.31050.31430.36920.30900.34840.27029:12AM2017/8/110.28930.30840.32340.37970.29910.35960.270212:36PM2017/8/110.28740.29080.32940.38310.29870.36560.27024:00PM2017/8/110.28440.30430.33380.38180.30190.35870.27027:23PM60 附表2017/8/110.26660.29270.32040.37090.28610.34010.267010:47PM2017/8/120.28540.28820.33640.36530.25780.33380.26662:10AM2017/8/120.28010.27920.33000.35980.25560.33090.23445:34AM2017/8/120.27300.29980.32550.37160.29760.35360.23448:58AM2017/8/120.29210.31280.34200.39540.30920.37710.234412:21PM2017/8/120.30880.31730.36170.40090.30380.37260.23443:45PM2017/8/120.29010.31010.33960.39020.30510.36280.28297:09PM2017/8/120.26850.29530.33170.38340.29510.35460.275110:32PM2017/8/130.30150.30940.34950.36920.25460.34410.23291:56AM2017/8/130.30450.31520.35270.37260.25580.34630.23385:20AM2017/8/130.27410.30150.32790.38340.30620.35910.28548:43AM2017/8/130.29760.31860.34280.39470.31050.37220.285012:07PM2017/8/130.29360.29980.33680.38610.29570.36490.27543:30PM2017/8/130.28570.30560.32680.37970.30380.35480.27926:54PM2017/8/130.24990.28440.29720.35720.28840.33090.267910:18PM2017/8/140.28860.28930.33260.36000.25030.33020.22841:41AM2017/8/140.30450.30810.34290.36820.25690.34180.23615:05AM61 华北水利水电大学硕士学位论文2017/8/140.28720.31280.33920.38530.30620.36040.28438:29AM2017/8/140.29640.31650.34500.38490.30410.36990.283311:52AM2017/8/140.29230.29700.33620.38480.29660.36090.26983:16PM2017/8/140.28200.29660.32320.37410.29320.35320.26986:40PM2017/8/140.24390.27840.29010.35550.29230.33040.272810:03PM2017/8/150.27090.27040.32480.35250.24750.32400.22461:27AM2017/8/150.30240.31370.35080.37370.25630.34500.23534:50AM2017/8/150.27690.30040.32400.36900.30210.35160.28098:14AM2017/8/150.28870.30540.33450.37690.29830.35510.285211:38AM2017/8/150.30000.29960.33600.38810.30360.36490.28523:01PM2017/8/150.28410.30090.32230.37730.28870.35100.27496:25PM2017/8/150.24150.27360.28800.35480.29190.32810.27179:49PM2017/8/160.28710.28590.34220.36710.25350.34130.23311:12AM2017/8/160.30960.31560.35460.37670.26030.34820.23574:36AM2017/8/160.27210.30260.31200.36560.30110.34290.27698:00AM2017/8/160.29920.31780.33730.38570.30470.36840.281811:23AM2017/8/160.29810.30360.33990.39410.30380.37560.28182:47PM62 附表2017/8/160.28350.29760.32550.37860.29740.35720.28186:10PM2017/8/160.24430.27840.28670.34970.28800.32480.28189:34PM2017/8/170.28030.28480.34460.37070.25420.34330.281812:58AM2017/8/170.31070.32270.35850.38040.25950.35120.28184:21AM2017/8/170.26190.29250.30430.35440.28760.32830.28187:45AM2017/8/170.29700.31410.33020.38140.30040.36340.281811:09AM2017/8/170.29960.30280.35310.39600.30150.37890.28182:32PM2017/8/170.29170.30680.32190.38040.29640.36580.28185:56PM2017/8/170.23290.26340.28780.35570.29060.32640.28189:20PM2017/8/180.26360.26530.32770.35310.24640.33070.281812:43AM2017/8/180.30940.31950.35270.37480.25670.34930.23424:07AM2017/8/180.27820.30300.33240.37350.30560.34730.27817:30AM2017/8/180.29610.32040.34390.39230.30830.36750.283910:54AM2017/8/180.29120.29360.33660.38480.29790.36000.28392:18PM2017/8/180.25970.28820.32040.37650.29740.34880.28079:05PM2017/8/190.29120.31010.35590.37710.26340.35120.241712:29AM2017/8/190.31260.32610.36280.37910.25800.34930.23483:52AM63 华北水利水电大学硕士学位论文2017/8/190.28990.29010.33380.37430.30360.34370.27907:16AM2017/8/190.29510.31890.34240.38740.30150.36730.279010:40AM2017/8/190.29120.30020.34520.38440.29770.35630.27432:03PM2017/8/190.26080.28010.32790.38590.30340.35680.27198:50PM2017/8/200.28910.30900.35040.37310.26330.34740.238912:14AM2017/8/200.31720.33150.36300.37990.25870.35270.23663:38AM2017/8/200.28970.29810.34580.38570.29960.35340.27667:01AM2017/8/200.27470.30320.32180.37220.29790.34540.274110:25AM2017/8/200.28350.28480.34580.39320.29640.36730.27841:49PM2017/8/200.25520.27280.33260.38420.29420.35980.27345:12PM2017/8/200.22860.26720.30620.36690.29640.34160.27538:36PM2017/8/210.23100.26930.30260.35420.25650.33750.275312:00AM64'