• 1.21 MB
  • 2022-04-22 11:22:02 发布

城市供水管网水质检验监测模型研究

  • 68页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'分类号:TU991.31密级:公开档案号:2013-06-081403-14-012学号:1011022016硕士学位论文(2013届)城市供水管网水质检验监测模型研究研究生姓名张燕指导教师姓名刘成刚教授李翠梅副教授专业名称市政工程研究方向管网与设备系统优化论文提交日期2013年6月 苏州科技学院硕士学位论文城市供水管网水质检验监测模型研究硕士研究生:张燕指导教师:刘成刚(教授)、李翠梅(副教授)学科专业:市政工程苏州科技学院环境科学与工程学院二○一三年六月 MasterDissertationofSuzhouUniversityofScienceandTechnologyStudyonWaterQualityVerifyingandMonitoringModelofUrbanWaterSupplyNetworksMasterCandidate:ZhangYanSupervisor:Prof.LiuChenggangProf.LiCuimeiMajor:MunicipalEngineeringSuzhouUniversityofScienceandTechnologyDepartmentofEnvironmentalScienceandEngineeringJune,2013 苏州科技学院学位论文独创性声明和使用授权书独创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律结果由本人承担。论文作者签名:日期:年月日学位论文使用授权书苏州科技学院、国家图书馆、中国科学技术信息研究所的《中国学位论文全文数据库》等国家有关部门或机构有权保留本人所送交论文的复印件和电子文档,允许论文被查阅和借阅。本人完全了解苏州科技学院关于收集、保存、使用学位论文的规定,即:按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其他复制手段保存汇编学位论文;同意学校用不同方式在不同媒体上公布论文的部分或全部内容。(保密论文在解密后遵守此规定)论文作者签名:日期:年月日指导教师签名:日期:年月日 苏州科技学院硕士学位论文摘要摘要经自来水厂处理后的出厂水,已经满足生活饮用水的卫生标准。但经过复杂的城市输水管网输送到用户时,水质可能发生明显的变化。为了改善管网的水质,加强对管网水质的运行管理,有必要研究水质在管网中的变化情况。通过建立供水管网的水质模型,可以对管网水质进行预测,为水质的运行管理提供可靠的理论基础,对保障饮用水的水质安全具有重要的意义。本文以苏州市某管网末梢水质指标监测中的9个监测点为研究对象,结合实际情况,对监测得的实验数据采用4D检验模型、Dixon检验模型、Q检验模型、Grubbs检验模型这4种统计学检验模型进行离群数据数据的检验,并对检验结果进行分析,做出科学的取舍判断,为水质模型的建立和水质的预测奠定基础。以浑浊度为模型的控制指标,并选用多元统计回归和人工神经网络方法来建立管网水质统计模型。其中,运用SPSS软件建立多元回归模型并进行了求解,运用MATLAB来进行人工神经网络的训练检验。对研究范围内的对1号和9号监测点建立了水质模型,然后对这两个监测点管网水的浊度进行了预测。结果表明神经网络的模拟效果要比多元统计回归理想,模型的准确性较高,能应用于实际,而且进行离异数据筛选后的数据应用于模型后预测效果更佳。最后,结合研究范围内的实际情况,提出了水质统计模型的建立必须以大量的数据为基础,这是保证模型准确性和精度的前提;另外还提出了在建立水质模型之前,有必要进行离群数据的检验。在分析引起预测误差原因的同时,对水质统计模型的研究发展做出了一定的展望。关键词:输水管网,水质模型,预测,浑浊度,多元统计回归,人工神经网络I MasterDissertationofSuzhouUniversityofScienceandTechnologyAbstractAbstractWaterqualityhasmetthedrinkingwaterhealthstandardsafteritleftthetreatmentplant.However,throughcomplexurbandrinkingwaterdistributionnetworks,itmightdeteriorateseariouslywhenreachedtheusers.Inordertoimprovewaterqualitydrinkingofwaterdistributionnetworks,tostrengthentherunningmanagement,itwasnecessarytostudyitschangeinthenetworks.Establishingwaterqualitymodelofdistributionnetworks,notonlycouldforecastthewaterquality,butalsoprovidedreliabletheoreticalbasisfortherunningmanagementofwaterquality,allofthesehadvitalsignificanceforthewaterqualitysecurity.ThispapermakesastudyofnineindicatorsofwaterqualitymonitoringspotswithinanetworkendingsinSuzhou,andcombiningwithactualsituationteststheexperimentaldatawithfourkindsofthestatisticaltestmodel,involved4D,Dixon,QandGrubbstestmodel.Afteranalyzingthetestresults,itcouldmakeascientifictrade-offjudgmentforthepredictionofwaterqualitymodelandwaterquality,Thispaperpresentedtheapplicationoftwoempiricalmodelsforsimulatingandforecastingturbiditywithindrinkingwaterdistributionsystems.ThefirstwasamultivariatelinearregressivemodelwithdataanalysistoolSPSS;thesecondwasanartificialneuralnetworkmodelWithnumericalsimulationtoolMATLAB.ThepaperhadestablishedwaterqualitymodelswithNo.1andNo.9monitoringpoints,andforecastedtheturbidityforthesetwomonitoringpoints.Theresultsdemonstratedtheartificialneuralnetworkmodelhadbetter,theformerwasmoreaccuratethanthelatter,andtheartificialneuralnetworkmodecouldbeusedtothepredictionofpracticalwatersupplysystem.Thepredicteffectshewthatitmadeforecasteffectbetterafterthedatascreeningofbizarredatas.Finally,combiningwiththeresearcheddatasoftheactualsituation,drawaconclusionthatestablishingthewaterqualitymodelmustbebasedonalargeamountofdata,that’sthepremisetoensurethataccuracyandprecisionofthemodel;Andthenthoughtit’snecessarytoinspectabnormaldatasfromthegroupBeforebuildingthewaterqualitymodel.Attheendofthepaper,itnotonlyanalysedthereasonsofforecasterrors,butalsomadedevelopmentprospectsfortheresearchofwaterqualitymodels.Keywords:waterdistributionnetworks,waterqualitymodel,forecasting,turbidity,multivariateregressivemodel,artificialneuralnetworkII 苏州科技学院硕士学位论文目录目录摘要................................................IABSTRACT..............................................II第一章绪论..........................................11.1问题的提出及研究意义..................................11.1.1城市供水管网的现状...................................11.1.2课题的研究意义.......................................21.2国内外研究进展.......................................31.2.1国内研究进展.........................................31.2.2国外研究进展.........................................41.3主要研究内容及研究路线................................51.3.1主要研究内容.........................................51.3.2技术路线.............................................6第二章管网水质的检验..................................82.14种数学检验模型.....................................102.1.14D检验模型..........................................102.1.2Dixon检验模型检验结果...............................112.1.3Q检验模型...........................................13[9]2.1.4Grubbs检验模型....................................162.24种模型检验结果的对比与分析.........................182.2.1检验结果的分析......................................182.2.2检验方法的对比分析..................................192.2.3离异数据的取舍......................................192.2.4可疑数据取舍注意事项................................21第三章管网水质模型原理的研究.........................223.1管网水质模型的分类...................................223.2机理模型的介绍......................................243.3.1余氯衰减模型........................................243.3.2消毒副产物模型----三卤甲烷(THMs)..................263.3.3微生物模型..........................................273.3统计模型的介绍......................................28 苏州科技学院硕士学位论文目录3.3.1线性统计模型........................................283.3.2BP神经网络.........................................29第四章水质模拟预测..................................324.1水质模拟预测的基本路线...............................324.2预测方法............................................324.2.1预测方法的种类......................................324.2.2预测方法的选择......................................344.3多元回归模型........................................354.3.1主成分分析..........................................374.3.2建立多元回归线性方程................................404.4BP神经网络.........................................434.4.1没舍弃异常数据时模型的拟合和与预测..................434.4.2舍弃异常数据后模型的拟合和与预测....................454.4.3BP网络模型对两种输入样本进行预测的效果比较.........464.5两种模型的效果比较...................................47第五章水质预测模型的误差分析.........................495.1误差分析............................................495.2误差来源............................................50第六章结论..........................................536.1主要研究成果........................................536.2问题与建议..........................................53参考文献..............................................55致谢.................................................59作者简介..............................................60 苏州科技学院硕士学位论文第一章绪论第一章绪论1.1问题的提出及研究意义1.1.1城市供水管网的现状城市供水系统是城市生存的命脉,也是保障城市人民生活,促进城市发展生产建设不可或缺的重要物质基础,它目前已经成为我国城市可持续发展建设的一个重要制约因素。作为城市输配水管网重要组成部分之一的城市供水系统,自来水从水厂进入城市供水管网系统时是满足我国生活饮用水标准的,但是经过庞大的供水管网系统时会发生复杂的一系列的物理、化学和生物反应,而且还存在着管网对水质的二次污染,以致在出厂水到达用户时已经不能满足我国饮用水的卫生标准。近年来,随着社会的发展,人们生活水平的提高,用户对饮用水水量、水质、水压的安全性的要求越来越高,供水管网水质安全性与稳定性也相应地受到了越来越多的关注。尽管在整个供水系统的工程投资中,管网建造部分的造价比重大约占50%~[1]80%,供水管网的工程造价和维护管理费用非常大,但是为了满足用户对饮用水水量、水质、水压的要求,全国各个城市每年在供水管网系统的扩建与维护、改造以及运行上都要投入大量的资金。可是尽管全国各市对城市供水管网进行了改建、扩建和新建,使城市的供水面貌得到了很大的改善。但是整个系统中难免会存在着较多的需要禁用的管段,而且由于地理环境变化、管道腐蚀、老化等不可抗力自然因素的影响,以及交通量增大、水压过高、道路施工开完及施工质量引起的水锤等人为因素的影响,这多方面的影响仍然会对居民生活和工业生产造成很多不便。目前,我国城市供水管网水质受到很大的影响,其影响原因主要表现在以下几个方面:①管材对水质的影响近几年,我国对供水管网的管材质量要求越来越高,对配件技术的发展也有了相当大的重视。自来水的水厂水经输水管的长时间、长距离输送后,各水质指标的含量或多或少会有些变化,浊度和色度甚至会发生很大的变化。在确保饮用水满足用户需求这样一个宗旨出发,在选用供水管道时应该逐渐推广使用聚乙烯管、硬聚乙烯给水管、交联聚乙烯管、钢塑管、铝塑管、聚丙烯管等管材的给水管道,减少管道对出厂[2]水造成的二次污染,合理选用的管材。②管网压力负荷大和加压设备对水质的影响城市的用水量随着城市人口量的增长和经济的发展不断增加,供水管网系统的改造与规划已经满足不了城市的发展和供水范围的扩大,这样的情况导致已存低标准管1 苏州科技学院硕士学位论文第一章绪论道长期处于超负荷的运行状态,造成了管网系统的不适应问题。同时,在这样的情况下,为了确保供水的稳定性,通常采用设置屋顶水箱二次加压的办法,由于水箱的容积大、冲洗不及时、室内供水方式使得水在水箱内贮存停留的时间过长,以及管理不善等都会使得水质变坏;另外,现在的高位水箱和蓄水池大多是钢筋混泥土结构,有的内衬涂料采用的是一些不抗水力冲刷,易脱落的材料,有的还未作内衬处理,这些都会造成出厂水水质的二次污染。③不合理加氯造成的影响为了保证出厂水和管网水的水质,对出厂水进行消毒已变得十分必要,但是加氯消毒虽然使得出厂水和管网水的各项指标均满足了要求。有研究表明:如果水中含有腐殖酸之类的有机物时,加氯后会产生卤代烃之类的消毒副产物,加氯量越高,产生的副产物也会越多,因此,不合理的加氯同样会影响水质的变化及饮用水的安全使用。④供水管理不科学[3][4]城市供水普遍具有这样几个特点:ⅰ.供水管网的敷设年代比较久远,而且错综复杂;ⅱ.城市在不断发展建设时,对供水管网进行不断的改造与扩建,使管网敷设的随意性和隐蔽性增强;ⅲ.管网敷设在地下,使维护、维修管理变得没那么直观和可预见。这三个特点表明我国供水行业对供水管网的管理水平还不够完善,迫切需要科学有序的方法来加强对管网的维护以及管网水质的监测。综上所述,尽管我国供水行业已经取得了进步,但是仍然存在着各种问题使得出厂水水质受到二次污染,造成供水系统的预警技术及维护管理难以实现等问题。1.1.2课题的研究意义为了保证供水系统的安全性和稳定性,当前我国各大供水管网均在进行信息化、数字化建设,在线水质、水量、水压检测设备与系统正逐步完善与形成。在对管网水质进行监测过程中会获取大量的数据,在这大量水质数据中,由于监测方法、仪器、操作和环境等方面的原因,可能存在人为误差、偶然误差、系统误差。如何检验与消除这些误差对数据准确性的影响,是数据检验检测的一个重要内容。尤其是在外界条件相同的情况下,多次重复分析监测可以得出一组平行的数据,而且在这组数据中可能会发现个别的数据显现出异常的特征,明显偏离其他大多数数据,但又找不到产生偏差的确切原因,这类个别数据就称为可疑数据。对于这类可疑数据的取舍一定要经过科学慎重的检验,因为若该可疑数据不属于异常值,将它舍去后,尽管表观上提高了这组数据的精密度,但实质上却降低了这组数据平均值的准确度;如果该可疑数据确是异常值,却没有将它舍去,这不仅降低了监测数据的精密度,而且2 苏州科技学院硕士学位论文第一章绪论使所求的结果也不科学可靠。因此随着大量在线数据的生成,数据检验检测工作急需科学、标准的方法来指导,以便及时、快速发现异常数据、离群数据等,为水质、水量、水压科学调度奠定良好的基础,而且通过数理统计方法,将确实可疑离群的非正常值舍弃,是保证测定结果准确度的重要措施。另外运用计算机来模拟管网的水质变化情况,不仅解决了现场检测所有管段水质变化情况的难题,而且还可以全面地、实时地了解水质在整个管网系统中的分布近似情况,确定出影响配水管网水质变化的因素后,得出各因素之间的相关关系以及各因素对水质变化的贡献率。因此,以通过统计学数学模型检验出的管网水质数据为前提,再利用数学模型来模拟水质的变化,以预测并控制管网的水质变化情况,这已经成为给水行业发展的必然趋势,有利于供水企业工作者有效指导生产,能达到对整个供水管网水质的预警和控制的目的。1.2国内外研究进展1.2.1国内研究进展目前,国内外已有不少行业将统计学模型应用其中。例如哈尔滨工业大学的赵洪宾教授在研究供水管网水质时,已经指导学生将统计学检验模型应用在北方某城市的[5]给水管网水质数据的取舍中。1982年,在模型精度检验方面,邓聚龙先生提出了关联度检验,但这种检验方法只能局限于他首创的灰色模型中的GM(1,1)模型,并非什么模型都可以效仿;1991年,山东师大将统计学数学模型与模糊是模型结合,建立了糖尿病分形的计算机系统,应用于临床系统后,证明出该系统具备简捷性、实用性、可靠性等特点[6]。1999年,中国石油大学依靠沉积学与统计学方法,再结合通过各种途径取得的信息,针对我国东部各个油田高含水期面临的稳定生产问题,最终提出了采用建立预[7]测模型来缓解解决这一难题的方法,为油田的进一步潜挖作出贡献。2003年,中国科学院地质与地球物理研究所采用沉积模型的三个种类中最为有[8]利的统计学模型来研究储层的随机建模技术。2007年,张绍周先生等将统计学检验模型中的4D检验法、Dixon检验法、Q检验法、Grubbs检验法这4种检验方法应用于水泥生产中,以对异常数据进行检验筛选[9]。3 苏州科技学院硕士学位论文第一章绪论2008年,中国科学院的张展、王利生等已将统计数据结合统计学模型与遥感模型对各种粮食资源进行预测,通过其对应的草谷比转化得到秸秆资源,建立预测评估[10]系统来对秸秆资源的综合利用提供科学有效的解决途径与手段。2010年,河海大学水文水资源与水利工程科学国家重点实验室在对裂缝的转异诊断中,也利用了检验统计模型结构稳定性的Chow检验模型,将动力学结构突变与统[11]计学模型的检验方法结合,获取了混凝土坝裂缝时的转异点。2012年,衡水学院的史文雷老师为了加强学生在统计学问题上的理解与学习,将[12]模型思想融入教学中,应用统计方法将统计学中的数学问题模型化。尽管国内对水质模型的研究起步较晚,但是在这方面也进行了大量的研究。20世纪80年代中期,赵洪宾教授在研究管道内壁结垢的基础上提出了“生长环”[13][14]的概念,并通过现场试验推导出了配水管网中的余氯衰减模型,到90年代末国内也建立了几种输配水系统的水质模型。20世纪90年代末期,哈尔滨工业大学的吴文燕博士在导师赵洪宾的指导下,与[15]哈尔滨自来水公司合作,对管网中物质的瞬时浓度进行追踪,监测出配水管网中的[16][17]水质变化,并模拟和校核了余氯在输水管网中的变化规律。20世纪90年末期,哈尔滨工业大学李欣博士填补了国内在配水管网中三卤甲烷浓度变化的研究分析,对余氯衰减模型和消毒副产物的前驱物质进行了较深入的研[18]究,且在国内首度提出了三卤甲烷在浓度分布上的水质模型,并且应用于实际的配[19]水管网后,发现计算值与观测值有很好的一致性,证明了该模型的有效和可行性。但是在实际生产中,水质模型的应用还较为不普遍。1.2.2国外研究进展对于统计学检验模型,国外也已经将其运用在了社会发展与评价、环境保护与持续发展、资源保护与利用、分子生物学、高科技农业研究、生物制药技术、流行病规律研究与探索、人类染色体工程研究、质量与可靠性工程等诸多领域。对水质模型的研究,国外学者大约起步于20世纪70年代。1980年Wood提出的水[20]质模型是基于稳态水力模型的,该模型是在静态水力的条件下,并利用质量守恒的原理,以达到确定配水系统中某种组分浓度在时间和空间上的分布。[21]1986年Clark等人相继提出的水质模型能在时变的条件下模拟水质的变化。[22]Males等提出了稳态系统的条件洗混合问题的一个算法,类似于Wood的模型。Murphy提出的模型服务于管网中的稳定流,能用来决定管网中氯浓度的空间分布。因为稳态水质模型只能够做到周期性的评估,在管网的水质预测上缺乏灵活性,[23]因此,Lious和Kroon提出了能够计算配水管网中物质的衰减与生长的模型,该模型4 苏州科技学院硕士学位论文第一章绪论以时间与位置的函数形式表示出了物质的浓度,并且还把管网中的物质流动分成了水平流动、随着时间衰减和增长以及管段连接处的混合这个三个过程。1988年Grayman等提出了一个类似的水质模型,这种水质模型大部分都使用的是“扩展时段模拟”(EPS)方法,由于它们没有模拟因流速变化造成的惯性影响,所以应称作准动态模型。[24]为进行管网水质模拟,Rossman等提出了DVEM,即离散体积元素法,该法是把配水管网当成是由有限的一些链接组成的系统,在每个链接内将物质质量分配了离散体积元素,因反应发生在每个元素内,因此物质质量能从一个元素平流地传输到下一个元素,管网节点处质量和流量提及也会混合在一起,这种跟踪管网中物质瞬时浓度的算法是利用时间来驱动水质模型实现的。[25]Chaudhry和Islam提出的计算机模型强调分析的管网系统初始稳定状态的条件是确定的,然后再针对一个控制方程来作数值积分,以计算缓变流状况下的相关参数,这种模型是在非稳定流的状况下,利用一个组合系统的方法计算组分流经管段时的传播和衰减。为了使模型能与实验数据相匹配,Heraud等因管材的不同而使用了不同的衰减系数,最有代表性的是Rossman等基于质量传输的一个余氯衰减模型。[26]Rodriguez等人从另一个角度对余氯在配水管网系统中的衰减进行了研究,提[27]出了人工神经网络模型。在这个基础上,Rodriguez和Serodes也对余氯衰减在供水管网中的线性与非线性模型作出了比较分析。[28]目前的最新报道是:WindsorSung等关于输水管网中消毒副产物的变化规律进行[29]的研究。为了预测配水管网中细菌的变化,Piriou等还对PICCOBIO软件在这方面的作用进行了研究。1.3主要研究内容及研究路线1.3.1主要研究内容本课题分为两个阶段进行研究。第一阶段主要是为水质预测作出准备,即供水管网水质数据的获取与检验分析。以苏州市某自来水厂管网末梢水质指标监测中的9个监测点为例,先采用四种统计学数学模型对这9个监测点的水质数据进行检验,并对检验出的异常数据进行取舍分析。第二阶段是依据第一阶段检验分析的数据来对进行预测。以9号监测点的水质指标为例,运用多元线性回归和BP人工神经网络建立模型,用检验分析前后的数据分别建立模型,对该管网的水质状况进行预测。课题的研究内容有以下六大部分:5 苏州科技学院硕士学位论文第一章绪论一、绪论。主要介绍了我国城市供水管网水质问题及其研究意义,并对国内外相关研究现状及趋势进行了概述,列出了本课题的研究内容和研究的技术路线。二、管网水质的检验。以苏州市某自来水厂管网末梢水质指标监测中的9个监测点为例,采用4D检验模型、Dixon检验模型、Q检验模型、Grubbs检验模型这4种统计学检验模型对监测点的水质数据进行检验,并对检验结果进行分析,对水质监测数据做出了科学的取舍判断。三、管网水质模型研究的原理。系统地介绍了几种水质数学模型,并分别对余氯衰减模型、消毒副产物模型、微生物模型这三种机理模型以及线性统计模型、BP神经网络这两种统计模型进行了详细的阐述与分析。四、水质模拟预测。首先选择了合适的预测方法,然后采用第二章中对9号监测点离群数据检验的结果,结合多元回归分析和人工神经网络这两种方法来进行模型的拟合,并将模拟出来的模型应用到9号监测点的实例中去,最终对两种模型结果进行比较分析。五、水质预测模型的误差分析。对第四章中两种模型运行出来的结果进行误差分析,并根据实际的状况来分析误差的来源。六、结论与展望。对供水管网进行数据检验前后的预测结果进行比较与分析,提出城市供水管网水质预测模型建立时存在的问题及其发展趋势。1.3.2技术路线根据上一节拟定的本课题的主要研究内容,可确定出本课题的技术路线。概括如下:ⅰ.通过在苏州某自来水厂实习,获得给水管网水质氟化物、硝酸盐、余氯、COD、pH值、铝、铁、氯化物、硫酸盐、溶解性总固体、总硬度、浑浊度等水质Mn指标的数据;ⅱ.结合给水管网检验的统计学数学模型:4D检验模型、Q检验模型、Dixon检验模型、Grubbs检验模型对数据进行检验分析,并得到相应的结果;ⅲ.列举出水质模型及水质预测模型的种类,最终确定采用多元线性回归和人工神经网络两种方法来建立模型;ⅳ.将检验出的水质数据结果应用于两种预测模型中,以对该管网的水质进行预测。ⅴ.将上述预测结果进行误差分析,并选出适合该管网水质预测控制的模型。主要技术路线如下图1-1所示。6 苏州科技学院硕士学位论文第一章绪论4D检验模型水质数据的监测Dixon检验模型Q检验模型水质数据的检测Grubbs检验模型分析舍弃离异数据未舍弃离异数据多元线性BP神经多元线性BP神经回归网络回归网络预测预测预测预测四种结果进行对比分析供水管网水质检验的预测模型图1-1技术路线图7 苏州科技学院硕士学位论文第二章管网水质的检验第二章管网水质的检验随着生活水平的提高,人们对自来水水质的要求也越来越高。自来水的出厂水水质尽管已经满足了饮用水标准,但是经过长时间长距离的输送后,在供水管网中发生的化学、物理、生物反应对水质会造成一定的污染,停留的时间越长,出厂水的化学稳定性及生物稳定性收到的考验越严峻,水质变得不合格的可能性也会越高,因此在给水管网末梢设立监测点来监测和控制整个管网中管网水水质也变得十分必要。有关资料显示,美国在采用区域统一供水时,有的出厂水在管网中的平均停留时间长达7d,法国瓦兹河梅里水厂的出厂水到管网末端的流动时间平均为3d,我国哈尔滨市的自来水厂出厂水在管网中停留时间约2d。通过对占我国总供水量42.44%的36个城市出厂水和管网水的调查,得知出厂水的平均浊度为1.3NTU,但是管网水却增加到了1.6NTU;从出厂水到管网水色度也由5.2增加到了6.71;铁的含量由0.09mg/L[30]增加到了0.11mg/L;细菌总数从6.6CFU/mL增加到了29.2CFU/mL。显然,管网水质的管理及提高也已经成了制约我国饮用水水质提高的瓶颈,提高管网水质管理的水平,必须加强对管网水质的有效监控,加大对实测数据的及时分析。在监测的大量水质数据中,难免有个别或者部分数据,其数值明显地偏离此批数据中的其余值,显现出异常的特征,对于这类离群数据的取舍,应该科学的判断,不能凭借经验来主观判断它们的取舍。本文以苏州市某管网末梢水质指标监测中的9个监测点为例,采用4D检验模型、Dixon检验模型、Q检验模型、Grubbs检验模型这4种统计学检验模型对监测点的水质数据进行检验,并对检验结果进行分析,对水质监测数据做出了科学的取舍判断,也对给水管网水质的科学调度奠定基础。表2-1是9号监测点水质指标的实测数据,图2-1为监测点的分布图。表2-19号监测点管网末梢水质指标实测数据溶解指标氟化硝酸余浑浊CODMnpH铝铁氯化物硫酸盐性总总硬度时间物盐氯度固体2012110.730.510.581.917.560.0990.1163.3884.79290135.490.342012100.731.060.631.777.480.1150.1566.5383.55287132.620.282012090.791.830.581.787.490.1130.1367.5490.96370140.430.272012080.961.530.581.857.530.0700.0773.0889.93360157.000.412012070.711.510.631.847.470.0410.0462.3775.98357165.780.362012060.961.530.331.977.530.0700.0773.0889.93360157.000.702012050.851.430.431.937.500.0700.0973.5887.26342155.050.552012040.681.620.551.987.500.0390.0761.8778.20292146.280.332012030.812.020.531.927.420.0490.0555.4493.23349157.000.242012020.681.220.482.007.400.0510.0353.8285.00197159.050.252012010.711.510.531.937.470.0410.0462.3775.98357165.780.388 苏州科技学院硕士学位论文第二章管网水质的检验溶解指标氟化硝酸余浑浊CODMnpH铝铁氯化物硫酸盐性总总硬度时间物盐氯度固体2011120.530.550.602.007.480.0880.0269.41104.96327143.340.392011110.791.350.501.877.560.0450.0770.56100.43390144.330.312011100.681.400.552.227.450.1140.1853.8279.85338141.380.242011090.570.720.401.667.520.0830.0271.93112.16316136.470.282011080.710.580.781.677.540.1840.0462.5079.85314135.550.422011070.791.350.581.727.560.0450.0770.56100.43390144.330.322011060.710.580.701.857.540.1840.0462.5079.85314135.550.262011050.851.430.451.897.50.070.0973.5887.26342155.050.482011040.890.950.52.237.520.1240.1165.0288.49401154.080.78注:除了浑浊度的单位是NTU、pH无单位外,其余10个指标的单位都是mg/L,其中总硬度以CaCO计,耗氧量用COD法、以O计。3Mn2图2-1监测点分布图9 苏州科技学院硕士学位论文第二章管网水质的检验2.14种数学检验模型2.1.14D检验模型4D检验模型的检验方法:在同一组实测水质指标数据中,运用统计学数学方法[9]对该组数据逐一进行计算。计算方法如下:D(X-Xn-1)/S(2-1)KD-------一组数据的公式计算统计量X-------一组数据中的可疑数(需将该组数据中的所有数据逐一作为可疑值进K行检验);Xn-1-------一组数据中除去可疑值后其余所有数据的平均值;S-------一组数据除去可疑值后其余数据的平均偏差;当D4时,被检验数据列为离群数据,标记为F;当D4时,保留,标记为T。按此方法对表2-1中的监测点水质指标的实测数据进行第一次检验,检验得到的结果如表2-2。表2-24D检验模型第一次检验结果溶解指标氟化硝酸氯化硫酸总硬浑浊余氯CODMnpH铝铁性总时间物盐物盐度度固体单位mg/Lmg/Lmg/Lmg/L--mg/Lmg/Lmg/Lmg/Lmg/Lmg/LNTU201211TTTTTTTTTTTT201210TTTTTTTTTTTT201209TTTTTTTTTTTT201208TTTTTTTTTTTT201207TTTTTTTTTTTT201206TTTTTTTTTTTT201205TTTTTTTTTTTT201204TTTTTTTTTTTT201203TTTTTTTTTTTT201202TTTTTTTTTFTT201201TTTTTTTTTTTT201112TTTTTTTTTTTT201111TTTTTTTTTTTT201110TTTTTTTTTTTT201109TTTTTTTTTTTT201108TTTTTTTTTTTT201107TTTTTTTTTTTT201106TTTTTTTTTTTT201105TTTTTTTTTTTT201104TTTTTTTTTTTT10 苏州科技学院硕士学位论文第二章管网水质的检验根据离群值检验法则,在检验时,应该对数据逐一检验,直至满足要求为止。按照以上法则及表2-2中显示的结果,在剔除第一次检验离群值的基础上需对监测点水质实测数据再次进行检验。表2-34D检验模型第二次检验结果指标氟化硝酸氯化硫酸溶解性总硬浑浊余氯CODMnpH铝铁时间物盐物盐总固体度度201211TTTTTTTTTTTT201210TTTTTTTTTTTT201209TTTTTTTTTTTT201208TTTTTTTTTTTT201207TTTTTTTTTTTT201206TTTTTTTTTTTT201205TTTTTTTTTTTT201204TTTTTTTTTTTT201203TTTTTTTTTTTT201202TTTTTTTTTFTT201201TTTTTTTTTTTT201112TTTTTTTTTTTT201111TTTTTTTTTTTT201110TTTTTTTTTTTT201109TTTTTTTTTTTT201108TTTTTTTTTTTT201107TTTTTTTTTTTT201106TTTTTTTTTTTT201105TTTTTTTTTTTT201104TTTTTTTTTTTT第二次检验的检验结果列入表2-3,与第一次检验结果一致,所以说明第二次不再检验出其他的离群数据,检验结束。用4D检验模型得出的离群数据为:2012年2月管网末梢的溶解性总固体。2.1.2Dixon检验模型检验结果Dixon模型的检验方法:将测得的数据从小到大排列x1、x2、x3,xn1、xn,[9]若最小值x或者最大值x为可疑值,然后按照下列相应的公式计算统计量r:1n当样本容量n3~7时,xxxx21nn1检验x的公式为:r;检验x的公式为:r;11nnxxxxn1n1当样本容量n8~10时,xxxx21nn1检验x的公式为:r;检验x的公式为:r11nnxxxxn-11n211 苏州科技学院硕士学位论文第二章管网水质的检验当样本容量n11~13时,xxxx31nn2检验x的公式为:r;检验x的公式为:r;11nnxxxxn-11n2当样本容量n14~25时,xxxx31nn2检验x的公式为:r;检验x的公式为:r;因为样本容量为11nnxxxxn-11n320,因此选第二套公式,n20,在显著水平0.01时,查表6得r0.535;n20,临界在显著水平0.05时,查表2-6得r0.450;当计算值大于临界值时,该检测数临界据是离群数据,用F标记,并分析离群的原因,再根据情况决定是否该舍弃;反之,标记为T,并予以保留,然后再重复检验。对此实测数据依Dixon检验模型的检验结果见表2-7。表2-6Dixon检验临界值显著性水平()显著性水平()nn0.050.010.050.0130.9410.988150.5250.61640.7650.889160.5070.59550.6420.780170.4900.51760.5600.598180.4750.56170.5070.637190.4620.54780.5540.683200.4500.53590.5120.635210.4400.524100.4770.597220.4300.514110.5760.679230.4210.505120.5460.642240.4130.497130.5210.615250.4060.489140.5460.641表2-7Dixon检验模型检验结果浑指标氟化硝酸余氯化硫酸溶解性总硬CODMnpH铝铁浊时间物盐氯物盐总固体度度0.01TTTTTTTTTTTT2012110.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2012100.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2012090.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2012080.05TTTTTTTTTTTT12 苏州科技学院硕士学位论文第二章管网水质的检验浑指标氟化硝酸余氯化硫酸溶解性总硬CODMnpH铝铁浊时间物盐氯物盐总固体度度0.01TTTTTTTTTTTT2012070.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2012060.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2012050.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2012040.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2012030.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2012020.05TTTTTTTTTFTT0.01TTTTTTTTTTTT2012010.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011120.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011110.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011100.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011090.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011080.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011070.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011060.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011050.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011040.05TTTFTTTTTTTT用Dixon检验模型得出的离群数据为:显著水平0.05时2012年2月的管网末梢的溶解性总固体和2011年4月管网末梢的COD。Mn2.1.3Q检验模型1951年,W.J.Dixon专为分析化学中的少量观测次数(n10)提出了一种简易的判断方法,即Q检验模型。Q模型的检验方法:将测得的数据从小到大排列x1、x2、x3,xn1、xn,若最小[31]值x或者最大值x为可疑值,然后按照下列相应的公式计算统计量r:1n13 苏州科技学院硕士学位论文第二章管网水质的检验xxxx21nn1检验x的公式为:r;检验x的公式为:r;11nnxxxxn1n1由于该样本容量为n20,所以在检测时应该在样本分成两个小样本进行检测,再将两个小样本检测的结果综合起来,就得到Q检验模型的检验结果了。此时小样本容量为10,查表2-8知:n10,在显著水平0.10时,r0.41;临界n10,在显著水平0.05时,r0.49;临界n10,在显著水平0.01时,r0.57;当计算的Q值大于临界Q值时,临界该检测数据是离群数据,用F标记,并分析离群的原因,再根据情况决定是否该舍弃;反之,标记为T,并予以保留。经过检验,发现Q检验第二次检验与第一次检验结果并无不同,故Q检验的第一次检验数据即为最终结果。Q检验模型的检验结果见表2-9。表2-8Q检验临界值显著性水平()测定次数n0.100.050.0130.900.970..9940.760.840.9350.640.730.8260.560.640.7470.510.590.6880.470.540.6390.440.510.60100.410.490.57表2-9Q检验模型检验结果指标氟化硝酸余氯化硫酸溶解性总硬浑浊CODMnpH铝铁时间物盐氯物盐总固体度度0.10TTTTTTTTTTTT2012110.05TTTTTTTTTTTT0.01TTTTTTTTTTTT0.10TTTTTTTTTTTT2012100.05TTTTTTTTTTTT0.01TTTTTTTTTTTT0.10TTTTTTTTTTTT2012090.05TTTTTTTTTTTT0.01TTTTTTTTTTTT0.10TTTTTTTTTTTT2012080.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2012070.10TTTTTTTTTTTT14 苏州科技学院硕士学位论文第二章管网水质的检验指标氟化硝酸余氯化硫酸溶解性总硬浑浊CODMnpH铝铁时间物盐氯物盐总固体度度0.05TTTTTTTTTTTT0.01TTTTTTTTTTTT0.10TTTTTTTTTTTT2012060.05TTTTTTTTTTTT0.01TTTTTTTTTTTT0.10TTTTTTTTTTTT2012050.05TTTTTTTTTTTT0.01TTTTTTTTTTTT0.10TTTTTTTTTTTT2012040.05TTTTTTTTTTTT0.01TTTTTTTTTTTT0.10TTTTTTTTTTTT2012030.05TTTTTTTTTTTT0.01TTTTTTTTTTTT0.10TTTTTTTTTFTT2012020.05TTTTTTTTTFTT0.01TTTTTTTTTFTT0.10TTTTTTTTTTTT2012010.05TTTTTTTTTTTT0.01TTTTTTTTTTTT0.10TTTTTTTTTTTT2011120.05TTTTTTTTTTTT0.01TTTTTTTTTTTT0.10TTTTTTTTTTTT2011110.05TTTTTTTTTTTT0.01TTTTTTTTTTTT0.10TTTTTTTTTTTT2011100.05TTTTTTTTTTTT0.01TTTTTTTTTTTT0.10TTTTTTTTTTTT2011090.05TTTTTTTTTTTT0.01TTTTTTTTTTTT0.10TTTTTTTTTTTT2011080.05TTTTTTTTTTTT0.01TTTTTTTTTTTT0.10TTTTTTTTTTTT2011070.05TTTTTTTTTTTT0.01TTTTTTTTTTTT0.10TTTTTTTTTTTT2011060.05TTTTTTTTTTTT0.01TTTTTTTTTTTT0.10TTTTTTTTTTTT2011050.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011040.10TTTTTTTTTTTT15 苏州科技学院硕士学位论文第二章管网水质的检验指标氟化硝酸余氯化硫酸溶解性总硬浑浊CODMnpH铝铁时间物盐氯物盐总固体度度0.05TTTTTTTTTTTT0.01TTTTTTTTTTTT用Q检验模型得出的离群数据为:显著水平为0.10、0.05、0.01时2012年2月管网末梢的溶解性总固体。[9]2.1.4Grubbs检验模型Grubbs模型的检验方法:将测得的数据从小到大排列X、X、X,X、X,123n1n若最小值X或者最大值X为可疑值,然后按照下列相应的公式计算统计量T:1n检验X的公式为:1XX1T;(2-2)S检验X的公式为:nXXnT;(2-3)S式中:X--------整个样本的算术平均值;n12S--------标准差,S(XiX);n1i1通过计算后将求得的T值与表2-10中的临界值T(,n)比较,如TT(,n),此可疑值应舍弃;反之,则应保留。如有两个可疑数据,先用上述方法舍去一个后,再重新计算X及S,再对第二个可疑值进行检验,依此计算下去,直到监测不出可疑值为止。对此实测数据依Grubbs检验模型的检验结果见表2-11。表2-10Grubbs检验临界值显著性水平()显著性水平()nn0.050.0250.010.050.0250.0131.1531.1551.155152.4092.5492.70541.4631.4811.492162.4432.5852.74751.6721.7151.749172.4752.622.78561.8221.8871.944182.5042.6512.82171.9382.022.097192.5322.6812.85482.0322.1262.221202.5572.7092.88492.112.2152.323212.582.7332.912102.1762.292.41222.6032.7582.939112.2342.3552.485232.6242.7812.963122.2852.4122.55242.6442.8022.987132.3312.4622.607252.6632.8223.009142.3712.5072.65916 苏州科技学院硕士学位论文第二章管网水质的检验表2-11Grubbs检验模型检验结果指标溶解氟化硝酸余氯化硫酸总硬浑浊CODMnpH铝铁性总物盐氯物盐度度时间固体0.01TTTTTTTTTTTT2012110.025TTTTTTTTTTTT0.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2012100.025TTTTTTTTTTTT0.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2012090.025TTTTTTTTTTTT0.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2012080.025TTTTTTTTTTTT0.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2012070.025TTTTTTTTTTTT0.05TTTTTTTTTTTT0.01TTTTTTTTTTTF2012060.025TTTTTTTTTTTF0.05TTTTTTTTTTTF0.01TTTTTTTTTTTT2012050.025TTTTTTTTTTTT0.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2012040.025TTTTTTTTTTTT0.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2012030.025TTTTTTTTTTTT0.05TTTTTTTTTTTT0.01TTTTTTTTTFTT2012020.025TTTTTTTTTFTT0.05TTTTTTTTTFTT0.01TTTTTTTTTTTT2012010.025TTTTTTTTTTTT0.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011120.025TTTTTTTTTTTT0.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011110.025TTTTTTTTTTTT0.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011100.025TTTTTTTTTTTT0.05TTTTTTTTTTTT2011090.01TTTTTTTTTTTT17 苏州科技学院硕士学位论文第二章管网水质的检验指标溶解氟化硝酸余氯化硫酸总硬浑浊CODMnpH铝铁性总物盐氯物盐度度时间固体0.025TTTTTTTTTTTT0.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011080.025TTTTTTTTTTTT0.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011070.025TTTTTTTTTTTT0.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011060.025TTTTTTTTTTTT0.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011050.025TTTTTTTTTTTT0.05TTTTTTTTTTTT0.01TTTTTTTTTTTT2011040.025TTTTTTTTTTTT0.05TTTTTTTTTTTF用Grubbs检验模型检验出的离群数据为:显著水平0.01、0.025、0.05时2012年2月的溶解性总固体和2012年6月的浑浊度,及显著性0.050时2011年4月的浑浊度。2.24种模型检验结果的对比与分析2.2.1检验结果的分析4D检验模型得出的离群数据为:2012年2月管网末梢的溶解性总固体。Dixon检验模型得出的离群数据为:显著水平0.05时2012年2月的管网末梢的溶解性总固体和2011年4月管网末梢的COD。MnQ检验模型得出的离群数据为:显著水平为0.10、0.05、0.01时2012年2月管网末梢的溶解性总固体。Grubbs检验模型检验出的离群数据为:显著水平0.01、0.025、0.05时2012年2月管网末梢的溶解性总固体和2012年6月管网末梢的浑浊度,及显著性0.050时2011年4月管网末梢的浑浊度。4种检验模型检验出来的共同离群数据是:2012年2月管网末梢的溶解性总固体;非共同离群数据是:2011年4月管网末梢的COD、2012年6月管网末梢的浑浊度、Mn2011年4月管网末梢的浑浊度。对于检验出来的共同离群数据,应在作出进一步分析的情况下确定其离群的原因。共同离群数据一般是因操作误差、管网水力工况发生瞬间变化等实验原因引起的,18 苏州科技学院硕士学位论文第二章管网水质的检验可以直接舍弃,当然也可以在水力条件稳定的情况下通过实验来获得正确的水质数据[5]。对于检验出来的非共同离群数据,应该重点监测,然后结合统计检验模型再次进[32]行检验并作出判断取舍。2.2.2检验方法的对比分析①4D检验法的优点是方法简单易记,不需要计算标准偏差,但是该方法只适用于测量次数较多的情况,当样本较小时,误差容易被忽略检验不出来。而且4D检验模型也不具有代表性,在各领域的专业性也不强。②Q检验模型和Dixon检验模型的检验方法类似,没有充分的利用所测定的数据,只是将最大可疑值和最小可疑值与相邻值进行了比较,因此检验的结果基本一致,对于只有一个可疑值的一组数据进行检验时可行性更高。③Grubbs检验模型检验出的离群数据最多,又因为在检验离群数据时,引入了X和S两个重要参数,不仅准确度高,而且代表性也更强。所以从该小样本少变量的实例实测数据通过检验模型的检验结果可知,不论是领域中的专业性,还是在异常数据的取舍上,Grubbs检验模型更具有代表性,敏感性更强,可适用性也更强。2.2.3离异数据的取舍浊度是一项重要的感官性状方面的监控指标,检验监测该指标对保证用水安全具有重要的作用。它虽然不属于危害人体健康的直接指标,但它们的存在会引起使用者[33][34]的厌恶感,而且严重时,很可能是水中含有有毒物质的标志。此批数据经过4种检验模型的检验,不仅浊度中有离群数据,而且溶解性总固体和COD中也检验出Mn离群数据。下面就检验出的离群指标进行分析。①CODMnCODMn表示化学需氧量,是指在一定的条件下,利用化学氧化剂(如KMnO4)将水中的还原性物质氧化,然后根据剩余的氧化剂的量来计算氧的消耗量。水中的还原性物质一般指有机物、亚硝酸盐、亚铁盐和硫化物等,其中含量最高的是有机物,所以,化学需氧量也用来作为衡量水中有机物含量的一项指标。一般化学需氧量愈大,水体受污染的程度也会愈严重。在目前应用最普遍的酸性高锰酸钾(KMnO)氧化4法和重铬酸钾(KCrO)氧化法中,尽管KMnO法氧化率较低,但测定方法比较简便,274在测定清洁的地表水质和地下水等有机物含量相对比较低的水样时较适用。19 苏州科技学院硕士学位论文第二章管网水质的检验生活饮用水卫生标准(GB5749-2006)规定,管网末梢水中耗氧量(COD法,Mn以O计)的限值是3mg/L,当水源受限制,原水耗氧量6mg/L时限值为5mg/L,2监测的水质均满足此规定。但Dixon检验模型仍然监测处2011年4月的COD指标Mn离群,通过对2011年4月8号监测点其他各水质指标的观察,发现该月管网末梢水的浊度相对较高,但仍没有超过生活饮用水卫生标准(GB5749-2006)规定的1NTU,而且该月的浑浊度也被Grubbs模型检验出离群。由此可见,浑浊度的大小直接影响着COD的多少,这两个离群数据的检验并不是偶然,而且受人为操作的影响也不大,Mn所以在进行下一步的运用及水质预警时可以将该组数据剔除,以达到提高精度的目的。②溶解性总固体溶解性总固体(TotalDissolvedSolids—TDS)指单位体积水样中溶解无机矿物成分的总质量,其成分是K、22-2-Na、Ca、Mg、HCO、CO、CL、SO、334F2HSiO、NO、等,其含量主要取决于Ca和Mg的含量。溶解性总固体是水233质的一项感官性状,一般TDS值愈大,说明水中的杂质含量愈大,反之,愈小。生活饮用水卫生标准(GB5749-2006)规定,管网末梢水中溶解性总固体的限值是1000mg/L。4种模型都共同检验出了2012年2月管网末梢的溶解性总固体离群,对公共离群数据的取舍应该做进一步的系统分析,确定该监测指标是操作误差引起离群,还是管网水力瞬变引起,然后再做出取舍。③浑浊度浑浊度就是水的澄清度,是水的一项感官性状指标。它是由泥沙、污泥、微生物和有机物质等引起的,属于感官性状方面的要求。水中浊度的高低,暗示着水中病原微生物、细菌、病毒潜伏的程度以及水中有机物含量的高低。浊度高时不仅令使用者感到不快,而且细菌、病毒及其它有害物质往往会付着在形成浊度的悬浮物中,因此,降低浊度不仅是为了满足人们对水感官性状的要求,而且对限制水中其它有毒、有害物质含量也具有积极意义,故各国在饮用水水质标准中均力求降低水的浊度,把降低水的浊度作为提高水质的一项基础工作。生活饮用水卫生标准(GB5749-2006)规定,浑浊度的量不得超过1NTU(水源与净水技术条件限制时不得超过3NTU)。本文中监测的浑浊度都是满足规定的,但是仍然检验出了离群数据,可能是监测过程中操作方法引起,也可能是管网水质监测中自来水生产过程中有些环节未处理好,如原水浊度突变但生产中没及时进行处理;个别滤池发生渗漏;管网接头施工工程竣工后阀门开启过快过急;较大干管通抢修完通水后内部有杂物或者阀门开启过急;用户违章采用的间接供水设施和市政供水管道20 苏州科技学院硕士学位论文第二章管网水质的检验连通,在市政管道压力降低后,二次水倒灌进入市政供水管网造成污染等一系列原因引起。因此应当对该离群数据所在监测点的浑浊度指标重新监测检验,根据监测检验结果再做出最后的取舍。2.2.4可疑数据取舍注意事项①剔除可疑数据时,检验的整组数据基本都是按从小到大的顺序排列的,最大值和最小值都是最有可能的可疑值,所以必须先对检验样本的最大和最小值进行判断。②不允许一次同时剔除多个可疑值。每次检验时,每组数据每次只能剔除一个,然后对剩下的数据重新进行检验,如此逐个地剔除,直至剩下的数据中无可疑数据。③对同一组数据中的可疑值用不同的方法进行检验,得到的结论不一定相同,因此国家标准GB4883-85推荐:如检验一个可疑值,以Grubbs检验法为准;检验一个以上可疑值,以Dixon检验准则为准。④显著性水平应尽量选得稍小一些,以使数据不被轻易剔除。如显著性水平在0.01和0.05两数中任选其一,则常常选取0.01。21 苏州科技学院硕士学位论文第三章管网水质模型原理的研究第三章管网水质模型原理的研究系统工程中应用最为广泛的模型是数学模型,它用形式化的数学语言,以某种数[30]学结构的方式,抽象地表示出某事物系统的主要特征和主要关系。3.1管网水质模型的分类数学模型按照不同的分类标准大致可以分成解析模型、图标模型、网络模型和逻辑模型这样几类。供水系统水质模型通过利用计算机来实现水质参数和某种污染物质在管网中随时间和空间的分布的模拟,或者某种水质参数产生变化的机理模拟。表3-1水质数学模型的几种分类分类标准分类备注动态模型变量状态是时间的函数时间和变量的关系稳态模型不随时间变化线性模型各变量之间呈线性关系变量之间的关系非线性模型各变量之间呈非线性关系确定性模型变量都按照某种确定的规律变化和运动变量的变化规律随机性模型变量的变化是随机的在环境系统模型中,适用于环境质量的模模拟模型拟、预测和评价模型的用途用于环境系统的规划和管理决策,使设计管理模型和运行处于最佳或较佳的状态。集中参数模型参数不随时空变化模型中参数的性质分布参数模型参数在时间或空间上按一定的规律分布白箱模型模型的结构灰箱模型黑箱模型稳态水质模型模拟管网的水力工况动态水质模型余氯衰减模型模型的研究对象消毒副产物模型微生物模型机理模型是否依赖机理统计模型下面对按照模型的结构分类、按照模拟管网的水力工况的分类、按照模型的研究对象分类、按照是否依赖机理分类这四种分类标准进行更详细的阐述。按照模型的结构可以大致分为白箱模型、灰箱模型和黑箱模型。①白箱模型也称为机理模型,它建立在客观事物变化规律的基础上,虽然适用范围大,但在实际中却很难得到一个完全的白箱模型。22 苏州科技学院硕士学位论文第三章管网水质模型原理的研究②灰箱模型灰箱模型是人们对客观事物认识不充分,虽了解各因素之间质的关系,但却不确定量的关系时,采用一个甚至多个的经验系数来对事物定量化的模型,因此,也称为半机理模型。③黑箱模型也称为输入—输出模型。黑箱模型属于纯经验模型,它在建立各个变量之间的关系时,只需根据系统的输入、输出数据,而不需要追究它内在的机理。黑箱模型大多是针对某个具体系统或者某种具体的状态建立,存在一定的局限性。大量日常观测数据的积累和数据的专门试验测定是建立黑箱模型的首要条件,然后根据输入-输出的关系在各种坐标格纸上绘制曲线,再依据曲线的形状就可以选配出各种表达式。在实际工程中,完全的白箱模型是很少的,黑箱模型在应用时会受到限制,因此应用较多的一般是灰箱模型。灰箱模型在建立时,一般是根据系统各变量之间的物理、化学或生物过程,首先建立起原则关系,再依据输入-输出数据来确定待定参数。管网水质模型按照模拟管网的水力工况划分,分为管网稳态水质模型和管网动态水质模型。在静态的水力条件下,稳态水质模型利用质量守恒原则,首先确定溶解物(污染物或消毒剂)浓度的空间分布,然后跟踪管网中溶解物的传播、流经路径、水流经管道的传输时间,最后用一组线性代数方程来描述某组分在管网节点处质量平衡的状况。管网稳态水质模型一般用在管网系统的水质分析阶段,它为管网的一般性研究及敏感性分析奠定了有效基础。但是,在用户水量发生变化之前,即便管网运行状态接近稳定状态,管网中的物质也没有足够的时间传播或者达到某种均衡的分布,所以,稳态水质模型只够给予周期性的评估,在管网水质预测上不够灵活。根据节点的质量平衡,可以写出典型的稳态水质模型:QextCext(QC)in(-QC)out(3-1)其中Q和C进入或者流出节点时物质的流量和浓度;extextQ进入或者流出节点时物质的流量;C进入或者流出节点时物质的浓度。在水力工况变化的条件下,动态水质模型能动态地模拟配水系统管网中物质的移动与转变。引起水力工况变化的因素有阀门的设置、水量变化、蓄水池水位变化、蓄水池和水泵的开启及停止、应急水量的变化等。根据模型的研究对象不同,可以分为余氯衰减模型、消毒副产物模型和微生物模型。23 苏州科技学院硕士学位论文第三章管网水质模型原理的研究[27]根据是否依赖机理,可以分成机理模型和统计模型。近年来,有不少国内外的专家针对不同的监测指标研究了建立管网水质模型的一系列方法,其中机理模型包括余氯衰减模型、消毒副产物模型和微生物模型,目前研究得比较成熟的是余氯衰减模型,消毒副产物模型的研究也愈来愈完善的了,而微生物模型研究还处在起步阶段。建立统计模型需要大量相关的水质数据,目前被提出的统计模型中模型的控制指标主[35]要有余氯、总三卤甲烷(TTHMs)、卤乙酸等。下面对机理模型和统计模型中的几种水质模型进行简要的介绍。3.2机理模型的介绍3.3.1余氯衰减模型余氯是管网水质的主要指标,出厂水在管网的输送过程中要维持足够的余氯以保证用户的饮水安全。含有一定余氯浓度的出厂水进入供水管网后,由于管道流速与流向的变化,余氯在供水管网中与管壁发生的反应,以及各种余氯浓度水的混合,都能引起供水管网中余氯浓度的逐渐衰减。因此,可以通过采用供水管网数字化的水力建[36]模来建立供水管网的余氯水质模型,以实时地模拟计算出供水管网的余氯浓度。大部分余氯水质模型是还处在研究余氯在配水管网中的衰减动力学公式上,即管网中任一点的余氯浓度与该监测点管段的水力条件间的关系。[37]目前对余氯衰减的研究主要可以分为以下两方面:①研究影响余氯衰减的各个因素。目前比较确定的影响因素有:温度、pH,以及水中有机物的含量等,但因为管道系统内情况的复杂性,因此仍然存在着很多未知的影响因素在探索研究中;②相对于上面的定性认识,国内外很多学者已开始从定量的角度来分析余氯的衰减规律,致力于建立余氯衰减模型的研究,而且研究出了很多较为成熟的模型,其中有不少模型已经被应用于实际工程,且取得了较为满意的效果。3.2.1.1余氯衰减的影响因素余氯的衰减在管网中受到很多因素的影响,这些影响因素可以概括为下列两个主要方面:(1)与管道中有机物和无机物等物质的反应;(2)余氯与生物膜、管材的反应,余氯在管壁腐蚀过程中的消耗,以及与管壁上生长环中的消耗。[14]另外,氯在管网水体中的消耗还受到下列因素的影响:24 苏州科技学院硕士学位论文第三章管网水质模型原理的研究①水温的影响因为给水管道是密闭遮光的,所以管道中余氯的衰减受水温的影响很大。温度越高,余氯在管道中的衰减速度也越快,因此管道中的余氯衰减速度夏季比冬季快,南方比北方快。②管径的影响余氯和管壁的接触面积越大,余氯的衰减速度也会越快。若令管道中单位体积的水与管壁的接触面积之比称为接触率,则:2rl224R2(3-2)rlrdd2其中R-----接触率;d-----管道的直接,m;r-----管道的半径,m;l-----管道的长度,m;由此式可看出管接触率和管道的直径成反比,管径愈大,接触率也愈小,余氯的衰减速度也会愈慢。③管材的影响余氯在管道中的衰减速度也受管材的影响,一般余氯在金属管材中的衰减速度比非金属管材中快,在未涂衬的金属管材中衰减速度也快。④pH的影响《生活饮用水卫生标准》(GB5749-2006)中规定,给水管网中水体的pH的限值为6.5~8.5,除非某些酸雨较为频繁的特殊地区外,pH值的波动都较小的,因此[38]在研究余氯的衰减时一般很少考虑pH值变化带来的影响。但是管道中水体的pH值与内壁的电化学腐蚀息息相关,而且管壁腐蚀、生物膜作用、水体中有机物的消耗都能引起管网中余氯的衰减。城市给水管网水体中的pH值虽然变化不大,对余氯的衰减影响较小,但是仍然不能忽略pH的作用,特别是管道的管材特殊时。⑤出厂水水质的影响余氯的衰减速度也受出厂水水质的影响。在水温、管径、管材等条件相同的情况下,出厂水的浊度愈高,有机物的含量也愈高,管网水中余氯的衰减速度也会愈高,反之不然。25 苏州科技学院硕士学位论文第三章管网水质模型原理的研究我国《生活饮用水卫生标准》(GB5749-2006)规定出厂水游离性余氯与水的接触时间至少为30min,其浓度不应低于0.3mg/L,在管网末梢不低于0.05mg/L。余氯过多会对用户的感官造成影响,余氯过少不仅不能抑制水中细菌的生长繁殖,还会让水体在输送过程送到二次污染,影响饮用水的饮用安全。为了使管网中各点都能保证有适当的余氯浓度,就要及时、全面地了解余氯在管网中的变化。因此,建立管网的余氯模型就可以根据监测到的有限数据快速准确地对管网中关键控制点的余氯量进行模拟和预测。3.2.1.2余氯衰减的一阶动力学模型管网水体中余氯衰减的一阶动力学模型为:C(t)Ce(3-3)AAOkt其中:C余氯的浓度;AC----出厂水进入管网时初始时刻的余氯浓度;AOk----余氯的衰减系数;t----衰减消耗的时间。3.2.1.3余氯衰减的二阶动力学模型管网水体中余氯衰减的二阶动力学模型为:C(1-K)AOC(3-4)AM(1K)t1-Ke[39][40]在美国环保局的资助下,美国学者ClarkR.M等通过实验得到K、M这两个常数的经验表达式:0.320.630.290.14Ke(C)(TOC)(pH)(T)(3-5)AO0.44Ln(M)2.46(0.19TOC)(0.14pH)-(0.07T)(0.01T*pH)(3-6)Clark.R.M等通过实验实测数据证实二阶动力学模型优于一阶动力学模型。尽管模型的准确度有了提高,但是二阶模型的参数过多,形式也较为复杂,使用过程中对水质数据的齐全度要求较高,因此尚未得到广泛的应用。3.3.2消毒副产物模型----三卤甲烷(THMs)液氯消毒的突出优点是具有余氯的持续消毒作用,价格较低,操作简便,不需庞大的设备。但氯在投入水体中后,将和水中某些有机物发生反应,生成对人体有害的副产物(DBPs)。水体中的消毒副产物最早是由荷兰人Rook在美国Neworiean水厂26 苏州科技学院硕士学位论文第三章管网水质模型原理的研究[38]发现的,当时所发现的消毒副产物为三卤甲烷(THMs),而该物质后来也被证实是水体中最为常见的、浓度最高的副产物。10%溴氯乙酸2%总卤乙酸3%2%水合氯醛卤乙腈20%62%三卤甲烷1%氯化腈其他[41]图3-1消毒副产物各种类所占比例图在水体中,三卤甲烷的生成与出厂水的浊度、液氯浓度、水中腐殖质等水质指标有关。它是水中的氯与消毒副产物的前驱物质反应所生成的,但这其中的反应过程是复杂而繁琐的,李欣博士在这方面有较深入的研究。如用反应式ClPTHM来表示三卤甲烷在水中的反应表达式,其中P表示水2体中能与氯反应生成三卤甲烷的前驱物质。通过文献[42][43]可知三卤甲烷的生成机理模型:CA(1-K)CSC-OTHMAO-M(1-K)t(3-7)1-Ke该机理模型中有K、M、S三个控制参数,其中参数K、M可以由余氯衰减的二阶动力学模型中的两个经验表达式求得,参照美国学者Clark.R.M的文献[44]也可以得出参数S的经验表达式:1.490.480.180.960.28Se(CA)(TOC)(pH)(T)(3-8)O表达式中TOC-----总有机碳(mg/L);OT-----温度(C);该模型提出得还不久,在实际中使用还不够广泛,现阶段还在不断的完善。3.3.3微生物模型满足国家饮用水水质标准的出厂水经过输水管输送到用户的过程中,在管道内部发生着物理、化学、电化学、生物等反应,使得微生物、细菌的分泌物质和产生的代谢产物不断积累、黏附在管道内壁,日久将会在管道内部出现一层厚度不一、不规则27 苏州科技学院硕士学位论文第三章管网水质模型原理的研究[45]的环状混合物,这种混合物称之为“生长环”。出厂水在输送的过程中,水沿着管壁流动时,并不是直接理想地沿着管壁表面流动,而是沿着管道内壁的“生长环”流动,这样就使得管网内水质受到二次污染,且导致管道的通水能力下降,增加电耗和漏失。而且,不仅生长环中的铁、细菌和有机物等成分对管网水质会造成较大的影响,而且在流速等水力条件改变的情况,由于水体的冲刷,生长环与水体的接触面也会增大,二次污染也会更加严重。因此,生长环是造成管网水质变化的主要原因之一。文献[46]对管网的生长环进行了一定的研究,作者得出生长环内的细菌数量和细菌产量是远大于水中的,而且生长环内的锰铜含量会影响异氧菌的生长,在生长环逐[47][48]渐成熟前,其生长会受到管材和管材粗糙度的影响。靠清洗管道去除生长环来改善水质只能暂时解决问题,是无法解决根本问题的,目前的微生物模型大多都是通过数学方法推导出来的,不能非常准确的反应客观事实,因此应该通过实验从微生物在管壁和管道水中的反应机理着手研究,分析水源水质、温度、管材、压力等对反应机理的影响,寻找出高效的模型算法来研究管网水质,从而实现更精确的动态模拟。3.3统计模型的介绍3.3.1线性统计模型一般的线性统计模型有很多不同的形式,其分类方式主要有以下3种:按因素多少可以分成单因素、二因素和多因素模型;按因素的性质可以分成固定型、随机型和混合型;按模型功能可以分成线性回归、方差分析、协方差分析及方差组分模型。线性回归分析和方差分析应用较为广泛。在实际应用中,事物的影响因素不是单一的,只是有些因素影响较小,有些因素影响较大,在结合多方面综合考虑的情况下,一般只需考虑影响较大的因素,这样,找出显著影响因素就变得尤为重要了。统计模型的表达形式一般如下:pdq1dq1dq1ytAiyt1B1ju1tjB2ju2tjBnjuntjet(3-9)i1jdjdjd式中:y----要模拟的变量,即因变量,本课题中指给水管网水质的浊度;tu~u----指影响管网水浊度变化的因素;1ne----代表模拟的信息;tp、q----分别表示因变量和自变量的自回归条目的级数;d----代表自变量延迟的时间;A、B、B----有待于估计的参数。i1jnj28 苏州科技学院硕士学位论文第三章管网水质模型原理的研究该模型的结构是完整的,既包括因变量也包括自变量,不仅考虑了自回归条目,而且还考虑了为模拟的信息。3.3.2BP神经网络1982年,Rumelhart、McClelland及他们的同事在洞察到神经网络信息处理重要性的情况下,成立了一个PDH小组,开展对并行分布信息处理方法的研究,在1985[49]年研究并设计出了BP神经网络。3.3.2.1BP神经网络原理BP神经网络是一种多层前馈型的神经网络,它通常是基于误差反向传播算法及BP(BackPropagation)算法的多层前向神经网络,目前的神经网络应用中有将近[50]90%是基于BP算法的。BP神经网络通常由输入层、隐含层、输出层三层构成,层和层之间的神经应用全互联连接方式据统计,每个输入都通过一个适当并相对应的网络权系数W和下一层链接。BP神经网络结构图如图3-2所示。误差反传(学习算法)jkiX1X2XnLMWWijjkQ输入层隐含层输出层信息流图3-2BP神经网络BP网络学习的基本思想是最小二乘法,在修正网络权值、阈值时要顺着表现函数下降最快的方向(负梯度方向),使得实际的输出值与预测的输出值的误差均方差最小。BP神经网络在应用于预测之前,必须要有一个网络训练学习的过程。神经网络根据输入的训练样本进行学习,自适应、自组织,然后确定各个神经元之前的连接权值W和阈值。在训练学习之前,针对不同的问题,有必要对网络训练的参数29 苏州科技学院硕士学位论文第三章管网水质模型原理的研究net.trainparam作出适当地设置。设置完训练参数之后,就可以调用train函数对BP神经网络开始进行训练了。3.3.2.2BP神经网络预测模型的构造(1)BP网络层数的确定在进行模型预测时,一般都采用只含有一个隐含层的三层BP网络建模。因为BP神经网络中隐含层数目及神经元个数确定的方法未得到统一,因此可以任意选取隐含层的层数和神经元的个数。为防止BP神经网络陷入局部极小、难以训练的状况,多采用只含有一个隐含层的三层BP网络,即输入层、隐含层、输出层。(2)输入层与输出层神经元数目的确定本课题中,BP神经网络的输入层神经元数目为引起给水管网水浊度变化的银子,共计11个,分别是:氟化物、硝酸盐、余氯、COD、pH、铝、铁、氯化物、硫Mn酸盐、溶解性总固体、总硬度。BP神经网络的输出层神经元数目是1个,即给水管网水质的浊度。(3)隐含层神经元数目的确定隐含层神经元数目的确定一直是一个难点,目前仍然没有一个很好的解析式来表示它,它与输入层、输出层神经元的数目及最终要达到的目标都有着直接的关系。通[51]常由下面三个公式来综合确定:niCnm(3-10)1i0nlogn(3-11)12nnn(3-12)10式中:n-----隐含层神经元的数目;1m-----训练样本数;n-----输入层的神经元数目;n-----输出层的神经元数目;0-----1~10之间的整数。通过上式综合确定出来的数值只能是一个范围,也会很难选择,因此在实际操作时需要一个一个的调试设置,直到满意为止。当输入层、输出层神经元数目变化时,为达到最佳拟合和预测的状态,还需要对隐含层的神经元的数目重新确定。3.3.2.3BP神经网络的局限性30 苏州科技学院硕士学位论文第三章管网水质模型原理的研究BP神经网络可以应用在线性和非线性系统中,使得对任意函数模拟时更加逼近,克服了感知器和线性神经网络带来的网络问题。但是,在训练中趋于稳定性要求使得学习率变小,因此梯度下降法就使得训练变很慢。对线性系统来说,学习率过小会使得训练时间过长;学习率过大又会使训练过程不稳定。对于非线性系统来说,选择好的学习率更加难。为了保证结果全局最优性,在实际的训练过程中,应该重复选取多个初始点来进行训练。另外,BP神经系统中,隐含层神经元数目的多少对网络训练也会有一定的影响,太多会造成网络的不适性,太多又会引起网络的过实性,因此隐含层神经元的作用机理和数目的选择是BP神经网络研究中的重难点。31 苏州科技学院硕士学位论文第四章水质模拟预测第四章水质模拟预测4.1水质模拟预测的基本路线本章的主要内容是:结合第二章中对9号监测点离群数据检验的结果,采用多元回归分析和人工神经网络这两种方法,先进行模型的拟合,然后将模拟出来的模型应用到9号监测点的实例中去,最终对两种模型结果进行比较分析,主要线路图如图4-1。预测方法的选择没有去除离群去除离群没有去除离群多元回归分析人工神经网络数据的样本数据的样本数据的样本模型拟合模型拟合模型拟合模型拟合模型应用模型应用模型应用模型应用结果比较图4-1水质预测流程图4.2预测方法预测是决策的基础,对最终决策方案的选择起着至关重要的作用,每个成功的决策都离不开科学地预测。预测必须建立在一定数量数据积累的前提下,然后结合事物的规律和机理来分析事物未来的发展趋势和变化状态。预测的前提条件是要积累一定数量的数据,而预测的关键环节却是对适合事物情况的最佳预测方法的选择。预测的方法尽管种类繁多,但是预测方法的选择在很大程度受限于提供的数据的数量、质量及变化规律的约束与限制。因此对某预测对象和某预测事物来讲,选择预测方法时必须要满足最终的目的以及提供的资料、信息等。4.2.1预测方法的种类管网水质预测是根据当前已知的管网水质指标数据和监测点所在位置来预测水质未来的变化趋势的,通过对水质未来变化趋势的预测以起到预警作用,达到防患于32 苏州科技学院硕士学位论文第四章水质模拟预测未来的效果。目前,水质预测技术处于形成发展阶段,常用的预测方法可大致概括为[52]两大类:机理水质模型和非机理水质模型。机理水质模型虽然能够精确地描述管网水系统中物理、化学、生物化学等变化的内在规律和相互关系,但是在操作、运行过程中需要大量的参数,这些参数的获取及分析亦需要消耗大量的物力、财力;而且水系统是一个复杂的系统,因此其细节的机理也不能完全被了解,采用机理模型也就不能对其进行准确的描述了,这些都成了制约了机理模型广泛应用的因素。非机理水质模型实质是黑箱式模型,通过数学统计方法或者其他的数学方法来建立模型,而且非机理模型是针对某一特定的物质系统,所以在进行模拟预测时也能得到较好的效果。下面对几种常用的非机理水质模拟预测方法进行简要的介绍。[53](1)回归模型回归模型是统计分析过程中所建立的数学模型。在水质预测方面,水质模型不仅可以通过自变量系数的确定来判断该影响因素对系统的整体影响程度,还可以由一个或一组随机变量来预测或者估计另一个或一组随机变量的值,自身完善的理论体系,令其在社会各个重要领域广泛应用。回归模型可以分为一元线性回归、多元线性回归、非线性回归等。[54][55](2)灰色系统预测模型灰色系统预测模型是国内学者邓聚龙教授提出的,灰色系统的概念和研究思想已经广泛地应用到社会的各个领域中。灰色系统模型等同于半机理模型,是在对客观事物认识不够充分,但是对各因素中质的关系了解,量的关系又不够明确的情况下建立的,是一个系统信息不够完全的模型。在水系统中有众多的影响因素,这些影响因素中既有已知参数又有未知参数,从这点上就可以把水系统看作一个灰色系统。尽管灰色预测模型对检测数据的信息量要求较少,但是它却要求原始数据序列满足非负性和单调性,对数据的要求较为苛刻,所以在应用中会存在一定的局限性。[56][57][58](3)人工神经网络模型人工神经网络是由大量的人工神经元连接,用来模仿人脑神经网络复杂的网络系统,有着多元性、良好的自适应能力等特点。其计算过程是通过非线性系统完成的,在预测时,也无需更多的考虑各环境影响因子之间的非线性定量关系,类似于黑箱模型只需通过神经网络的自我学习训练,来充分获取信息,从而预测未来环境变化时环境非线性系统的发展。当非线性系统的外部环境变化时,无需对神经元网络预测模型33 苏州科技学院硕士学位论文第四章水质模拟预测进行单独试验和参数识别,只需输入变化的信息后让网络系统重新进行学习训练就可以快速跟踪得出系统的变化了。[57][59][60][61](4)时间序列模型所谓时间序列就是按照时间的顺序排列的一组有序的数据。对时间序列中的数据进行观察和研究,寻找出它的变化发展规律,并预测它的将来走势,这就是时间序列分析。时间序列分析是数理统计学的一个分支,在遵循统计学基本原理的情况下,再利用观察的信息来估计数据的整体性质。介于时间的不可重复、唯一性,使得在任一时刻观察值的获取也具有不可重复、唯一性,这种特殊性也直接导致了时间序列分析的一套特殊、自成体系的分析方法。因此在运用时间序列模型进行检测指标的模拟预测时,需要充分完善的相关监测值,才能保证预测结果的正确性和有效性。目前,有很多常用于时间序列分析的专业统计软件,如SAS、Matlab、SPSS、[62]DPS等软件。在所依据的理论基础不同的情况下,可以讲水质预测模型大致分为五种,具体情况见表4-1。表4-1水质预测方法的分类比较预测方法理论基础数据资料特点难以程度概率论与数理单因素简单,数理统计法有较丰富的数据资料效果好,计算量大统计原理多因素繁琐灰色系统理论法灰色系统理论适用于资料较不足的情形不受实测资料限制简单已工具化、程神经网络模型法神经网络原理有较丰富的数据资料多元性、自适应能力强序化水质模拟模型计算不经济,精度难以水质模拟模型法有较丰富的数据资料比较复杂原理把握把设计多种影响因子的混沌理论法混沌理论有较丰富的数据资料复杂水质系统简单化4.2.2预测方法的选择回归模型可以把复杂的预测对象转化得相对简单,适应能力强,也可以在确定自变量系数大小的情况下来确定此影响因素对整个系统的影响程度,应用简单而广泛。灰色预测模型对检测数据的信息量要求较少,但是它要求原始数据序列满足非负性和单调性,对数据的要求较为苛刻,所以在应用中会存在一定的局限性。人工神经网络在预测时,无需更多的考虑各环境影响因子之间的非线性定量关系,只需通过神经网络的自我学习训练,来预测未来环境变化时环境非线性系统的发展。当非线性系统的外部环境变化时,无需对神经元网络预测模型进行单独试验和参34 苏州科技学院硕士学位论文第四章水质模拟预测数识别,只需输入变化的资料后让网络系统重新进行学习训练就可以快速跟踪得出系统的变化了,很适用于短期预测和动态训练系统。时间序列模型进行检测指标的模拟预测时,需要充分完善的相关监测值,才能保证预测结果的正确性和有效性,对数据资料要求较高。根据上述对各种方法的分析与比较,并结合本课题的具体情况来综合考虑,最终选定多元回归模型和人工神经网络模型来模拟预测管网水质。4.3多元回归模型线性关系是数学里最基本的关系,用线性关系来处理问题比较容易。在现实实践中,变量之间通常具有线性或者近似线性的关系。尽管许多变量之间是呈非线性关系[63]的,但是经过适当的处理变换后,新变量也能近似地看成线性关系。在现实实践中,通常存在着这样的情况:两个变量X、Y之间存在着一些依赖关系,其中变量X能部分地决定Y的值,但是这种决定关系又不是非常的确切,例如身高X和体重Y之间,身高X大时体重Y一般大,但却不是一定大,所以这是一种有依赖关系但是却依赖得不太确切的情况,变量之间的这种关系被相关关系,其中回归模型就是研究相关关系的一种有力工具。另外,在上述身高体重这一例子中,Y可以称为因变量,X称为自变量,其中Y的值由两部分确定,一部分是X决定的部分,可以表示成f(X),一部分由其他未充分考虑的因素影响决定,可以表示成e,因此可以得到模型Yf(X)e,若f(X)是线性函数f(X)X,则有模型f(X)Xe,0101这样的模型称为线性回归模型;实际问题中,因变量的影响因素通常很多,因此就需要考虑多个自变量引起的回归问题,可以建立如下的多元线性回归模型:YXXe,(4-1)011p1p1式中是常数项,、、是回归系数,e是随机误差。01p1当对变量Y,X,,X进行n次观测后,可以得到n组观测值:1p1x,,x,y,(i1,,n)i1i,p1i而且它们满足如下关系式:yxxe,(i1,,n)(4-2)i0i11i,p1p1i其中e是每次观测相对应的随机误差,是常数项,、、是回归系数。i01p1回归模型中回归参数估计的最基本的方法是最小二乘法,按照最小二乘法来估计回归参数时,回归模型满足以下假设:(a)E(e)0,i2(b)Var(e),(等方差)i(c)Cov(e,e)0,ij.(不相关)ij这就是GaussMarkov假设,用矩阵形式可以表示如下:35 苏州科技学院硕士学位论文第四章水质模拟预测y11x11x1,p10e1y21x21x2,p11e2,(4-3)yn1xn1xn,p1p1en等价于:yXe,(4-4)用矩阵的形式也可以将回归模型的假设表示如下:2E(e)0,Cov(e)I。n合并起来就得到线性回归模型:2yXe,E(e)0,Cov(e)I.n2用最小二乘法估计时,应该取偏差向量eyX的长度平方yX的最小值。即:2Q()yX(yX)(yX)(4-5)展开此式:Q()yy2yXXX(4-6)对求导,并命导数为0,可以得到方程组:XXXy,(4-7)称为正则方程,该线性方程组有唯一解时XX的秩必须为p,且唯一解是:^1(XX)Xy(4-8)^^^^令(,,,),则有:01p1^^^^YXX,(去掉了误差项)(4-9)011p1p1该方程被称为经验线性回归方程。对该回归方程进行显著性检验,必须假设所有的回归系数为0,即:H:0(4-10)1p1如果接受原假设H,则可以认为所有的自变量对因变量Y的影响不是很大,即影响不重要,或者建立的模型误差太大,超过了自变量对因变量Y的影响,即建立的回归模型有效性较小。若拒绝原假设H,就意味着至少是有一个是不等于0的,即因变i量Y是至少依赖于回归自变量中的某一个X的,说明建立的回归模型有效性很大。i当拒绝原假设时,回归平方和SS的相对试验误差就比较大,而且回归系数F也会回回比较大,各自变量间的线性相关程度也会比较高。综上,变量之间的关系可以总述为下面两方面:一是研究变量之间的相关关系,称为相关分析;二是研究自变量与因变量之间的关系,用模型或者方程式表示,称为回归分析,两者之间既有联系又有区别。在进行相关分析与回归分析时,不能机械地36 苏州科技学院硕士学位论文第四章水质模拟预测把毫无关系的影响因素和指标凭借数字间的偶然相关来决定它们之间的关系,而要在机理上分析是否确有联系,否则这样对数字进行的单纯研究将毫无意义。在线性回归模型中,自变量会随着试验条件、生产条件、社会经济条件等外界环境的变化而变化,因此相应的的因变量的取值也会发生变化,在这样的情况下,需要耗费的大量的时间和费用来估计和分析因变量的取值。在有了经验线性回归模型之后,可以在引起自变量变化的外界环境发生变化时,不进行试验就能对因变量的取值进行预测,这是回归分析中极为重要的应用之一。4.3.1主成分分析本课题应用SPSS软件对监测的水质数据进行主成分分析。主成分分析就是把原来的多个变量转化为少数综合指标的一种降维处理技术,变量太多会增加问题分析时的难度和复杂性,因此用较少的变量代替原来较多的变量,并使这些较少变量尽可能保留之前较多变量所包含的信息,这无疑是对多要素复杂研究系统的一种简单化处理。[64]SPSS软件是统计软件中最早采用图形菜单驱动界面的,操作界面极为友好、输出结果漂亮是它突出的特点。它的各种管理和数据分析方法的功能都是用Windows窗口方式展示出来,各种功能的界面都统一、规范,是非统计专业人员的首选统计软件。SPSS的统计过程普遍且较为成熟,采用类似Excel表格的方式来输入和管理统计数据,接口较为通用,可以方便地从其他数据库中读入统计数据。表4-2是CorrelationMatrix(相关系数矩阵),一般说来,相关系数高的变量很大可能会被分入同一个主成分。尽管主成分分析是从对相关系数矩阵特征根的计算开始,但是除了相关系数对主成分分析具有参考价值外,还要考虑各个指标数据的结构。表4-2CorrelationMatrix(相关系数矩阵)总硬度CODMn溶解硝酸盐氯化硫酸(以浑浊氟化物余氯(标准限pH铝铁性总(以N计)物盐CaCO3度值)固体计)氟化物1.0000.481-0.3120.1300.258-0.1080.3000.364-0.1310.4800.4010.581硝酸盐-0.400.4811.000-0.3540.128-0.6160.201-0.061-0.1490.3180.591-0.040(以N计)7余氯-0.312-0.3541.000-0.2930.1150.553-0.015-0.341-0.380-0.107-0.410-0.393相关CODMn-0.350.1300.128-0.2931.000-0.0850.343-0.377-0.2590.0410.3370.363(标准限值)7pH0.258-0.4070.115-0.3571.0000.2770.0240.6270.2360.422-0.4270.299铝-0.108-0.6160.553-0.0850.2771.0000.211-0.106-0.187-0.096-0.6410.04737 苏州科技学院硕士学位论文第四章水质模拟预测铁0.3000.201-0.0150.3430.0240.2111.000-0.055-0.2500.180-0.2920.048氯化物0.364-0.061-0.341-0.3770.627-0.106-0.0551.0000.5050.453-0.0460.450硫酸盐-0.131-0.149-0.380-0.2590.236-0.187-0.2500.5051.0000.237-0.240-0.027溶解性0.4800.318-0.1070.0410.422-0.0960.1800.4530.2371.0000.1940.409总固体总硬度(以-0.420.4010.591-0.4100.337-0.641-0.292-0.046-0.2400.1941.0000.365CaCO计)73浑浊度0.581-0.040-0.3930.3630.2990.0470.0480.450-0.0270.4090.3651.000表4-3TotalVarianceExplained(全部解释方差)InitialEigenvaluesExtractionSumofSquaredLoading成份(初始特征值)(载入提取的平方和)合计方差的%累积%合计方差的%累积%13.37128.09328.0933.37128.09328.09322.80823.39751.4902.80823.39751.49031.92616.05167.5411.92616.05167.54141.1919.92277.4621.1919.92277.46251.0758.95686.4181.0758.95686.4186.6405.33191.7497.3813.17894.9288.2622.18497.1119.1621.34698.45710.095.79099.24711.082.68699.93312.008.067100.000图4-2特征根水质衰减折线图38 苏州科技学院硕士学位论文第四章水质模拟预测由于主成分的数目可以依据相关系数矩阵的特征根来判断,在表4-3TotalVarianceExplained(全部解释方差)中,在初始特征根中,按大小顺序给出了的相关系数矩阵的各个特征根,因为有12个变量,而且第一个变量有:方差百分比=3.371/12=28.093%,第二个变量有:方差百分比=3.371/12=28.093%,依此类推有:各个成分的方差百分比=相关关系数矩阵的各个特征根变量数目,即:相关关系数矩阵的各个特征根各个成分的方差百分比变量数目,由此式可推出成分的方差等于相关系数矩阵的特征值,按照特征根来决定主成分数目的准则有[65]如下三点:①取特征根1相对应的主成分在表4-3中,前五个成分对应的值都大于1,等同于前五个成分的得分方差都大于1。②累计百分比达到80%~85%以上的值相对应的主成分在表4-3中,前五个成分对应的值累计百分比是86.418%,这表明只选取前五个主成分信息量就足够了。③按照特征值变化的突变点来决定主成分的数量通过图4-2特征根水质衰减折线图可以看出,第6个值是一个明显的这点,而且在表4-3中,第5个值到第6个值发生了很大的突变,所以可以选定主成分数目为5。且在表4-3右侧的ExtractionSumofSquaredLoading(载入提取的平方和)一栏中,提取出了5个主成分及有关的参数,其提取的结果能分别满足上面三个准则分析得出的结果,并且在进行程序操作时已设定了1。表4-4主成分方差与方差贡献率第一主成分第二主成分第三主成分第四主成分第五主成分公因子方差氟化物0.7200.2510.4040.2030.1620.812硝酸盐(以N计)0.687-0.406-0.0500.554-0.0660.951余氯-0.708-0.0120.2980.3330.4070.866COD(标准限值)0.350-0.4380.473-0.500-0.2820.869MnpH-0.0590.8900.1360.0590.1240.833铝-0.6240.3150.566-0.1390.0730.833铁0.092-0.0040.7020.288-0.1960.940氯化物0.3660.817-0.2190.014-0.0090.850硫酸盐0.0740.509-0.619-0.114-0.4450.860溶解性总固体0.5400.4860.1840.2990.0230.651总硬度(以CaCO计)0.754-0.438-0.139-0.1030.4180.9653浑浊度0.5960.3770.362-0.5130.2210.94039 苏州科技学院硕士学位论文第四章水质模拟预测方差贡献3.3712.8081.9261.1911.07510.371特征根3.3712.8081.9261.1911.07510.371方差贡献率(%)28.09351.4967.54177.46286.418从表4-3的结论和表4-4中五个主成分方差,可以得出关系:相关系数矩阵的特征根=方差贡献=主成分得分的方差。在提取主成分时,原则上是要求各个公因子方差在数值上尽可能接近,也就是希望它们的方差极小,当两个成分的公因子方差相近或完全相等时,它们的方差就为0,这样就达到了完美的状态,而在实际应用中,公因子方差的数值相差不远、彼此接近就行了,但是在表4-4的最后一列的结果显示中可知溶解性总固体的公因子方差与其他指标的公因子方差相差较远,在提取五个主成分的时候,溶解性总固体的信息可能会有较多的损失,而且在统计学中方差贡献反映了相对应的主成分的重要程度。从表4-4中可以看出,在第一主成分中荷载较大的是氟化物、余氯和总硬度(以CaCO计),意味着氟化物和总硬度(以CaCO计)这两个指标与第一主成分的相关程33度较高,余氯与第一主成分的负相关程度较高;在第二主成分中荷载较大的是pH和氯化物,这意味着这两个指标与第二主成分的相关程度较高;第三主成分中荷载较大的是铁,这意味着铁这一项水质指标与第三主成分的相关程度较高;第四主成分中硝酸盐(以N计)、COD(标准限值)和浑浊度的荷载较大,这意味着意味着硝酸盐(以MnN计)和浑浊度这两个指标与第四主成分的相关程度较高,COD(标准限值)与第四Mn主成分的负相关程度较高;第五主成分中荷载较大的是硝酸盐,即硝酸盐这项水质指标与第五主成分的负相关程度较高。4.3.2建立多元回归线性方程通过对表4-3结果的分析,前五个成分对应的值累计贡献率已经达到86.418%,这样可以选取前五个成分作为主成分。但是选取不同的主成分个数,并对其分别建立多元回归线性方程,再对方程的精度和显著性做出比较,以确定最佳的主成分数。建立多元回归线性方程的表达式如下:yaapcrapcrapcr(4-11)01122nn其中:pcr表示主成分;n表示选取的pcr个数。用软件SPSS对实验获得的水质数据进行回归分析,得到表4-5中的结果,并可建立不同那个主成分个数下的预测模型方程式。40 苏州科技学院硕士学位论文第四章水质模拟预测表4-5Coefficients(回归系数)UnstandardizedCoefficientsStandardizedCoefficientsModel非标准化回归系数标准化回归系数(模型)Sig.B标准误差t(显著性水平)Constant(常数)9.58019.2400.4980.000氟化物0.7560.6830.5701.1080.002硝酸盐(以N计)-0.2240.184-0.675-1.2190.003余氯-0.5190.420-0.358-1.2360.002COD(标准限值)0.3240.2640.3281.2300.004MnpH-1.3232.333-0.399-0.5670.003铝-0.0501.878-0.015-0.0270.001铁-1.0911.552-0.323-0.7030.002氯化物0.0110.0070.4571.4970.003硫酸盐-0.0070.008-0.479-0.9380.002溶解性总固体0.0010.0020.4640.9250.006总硬度-0.0030.013-0.180-0.1930.002(以CaCO计)3N=6时:y9.5800.756pcr-0.224pcr-0.519pcr0.324pcr-1.323pcr-0.050pcr123456N=7时:y9.5800.756pcr-0.224pcr-0.519pcr0.324pcr-1.323pcr-0.050pcr123456-1.091pcr7N=8时:y9.5800.756pcr-0.224pcr-0.519pcr0.324pcr-1.323pcr-0.050pcr123456-1.091pcr0.011pcr78N=9时:y9.5800.756pcr-0.224pcr-0.519pcr0.324pcr-1.323pcr-0.050pcr123456-1.091pcr0.011pcr-0.007pcr789N=10时:y9.5800.756pcr-0.224pcr-0.519pcr0.324pcr-1.323pcr-0.050pcr123456-1.091pcr0.011pcr-0.007pcr0.001pcr7891022表4-6中的RSquare(R)会随着主成分个数的增多而增大,R是衡量显著性22的统计量,一般R越大说明方程的拟合效果越好。而AdjustedRSquare(调整R)却不一定,它考虑了主成分的个数对拟合度的影响,是调整后的判定系数。表中的后面两项F、Sig.(显著性水平)是对模型的方差分析,是检验模型是否成立的重要条41 苏州科技学院硕士学位论文第四章水质模拟预测件。Sig.(显著性水平)值要求小于给定的显著性水平,本例中设定的显著性水平是0.05,一般Sig.越接近0越显著。F也是检验方程显著性的统计量,一般情况下也是越大越好。表4-6不同主成分个数下预测模型的参数RRSquareAdjustedRSquareSig.N22F(相关系数)(R)(调整R)(显著性水平)60.9090.8260.7863.4420.00170.9100.8280.7953.0010.00280.9480.8980.8265.3200.00190.9670.9350.8134.2810.003100.9700.9410.8013.9150.002从表4-6中不同主成分个数下预测模型参数的分析可以看出,当取N=8时,建立2的模型的调整R最大,而且显著性水平也小于设定的显著性水平,所以说明建立的模型很显著,因此选择N=8时的模型为本例的回归线性预测模型:y9.5800.756pcr-0.224pcr-0.519pcr0.324pcr-1.323pcr-0.050pcr123456-1.091pcr0.011pcr780.5实际值0.4预测值0.3NTU0.2浊度0.10.0编号201207201208201209201210201211图4-3模型预测结果图表4-7浊度实际值和预测值的比较相对误差编号实际值预测值绝对误差(%)2012070.360.13308-0.23-63.03332012080.410.28273-0.13-31.04152012090.270.0412-0.23-84.74072012100.280.11163-0.17-60.13212012110.340.1958-0.14-42.411842 苏州科技学院硕士学位论文第四章水质模拟预测通过运用软件SPSS对水质数据进行主成分分析,并建立多元线性回归方程,将20组数据分为两组,前15组用来建立模型,后5组数据用来进行水质指标浑浊度的预测。预测的结果及数据比较分别见表4-7和图4-3,从结果显示可见相对误差较大,可能因建立模型的方法或数据不充分完善所致。4.4BP神经网络BP网络是人工神经网络中最具有代表性的一种模型,它包括输入层、隐含层和输出层三层,输入层的每个神经元之间没有连接,而层与层之间实现的是全连接,即每个输入层都是通过一个适当的网络权系数和下一层相连接的。BP网络在进行水质[66][67]预测时一般包含训练、检验、预测三个过程。具体表现为如下三个步骤:ⅰ通过统计分析来确定预测对象即因变量的影响因子;ⅱ运用学习样本来进行训练和检验,直到拟合度满足精度为止;ⅲ根据训练和检验好后的资料信息来对水质进行预测。本课题将检测得的20组数据分为两大组,其中前15组数据作为输入样本层,浑浊度的数据作为输出样本层,经过多次的调试与分析对比后,确定隐含层的单元数为8;再以后5组数据对训练好的样本进行检验,当精度满足要求、拟合度好、显著性强时对后5组数据的浑浊度进行预测。本课题在第二章中已经对监测的水质数据运用4种统计学数学模型进行了异常数据的检验,4种模型检验出的既有共同的异常数据,又有非共同的异常数据,通过适当取舍,下面将异常值没取舍和取舍后的整体数据运用于BP网络进行预测。4.4.1没舍弃异常数据时模型的拟合和与预测图4-4人工神经网络训练拟合效果图(没舍弃异常数据时)43 苏州科技学院硕士学位论文第四章水质模拟预测图4-4是没舍弃异常数据时以前15组水质数据作为样本,学习训练后的效果图。如图所示,管网中浑浊度实测值与拟合值之间已经达到了R=0.99948的高拟合效果。再将整个样本即20组水质数据应用BP网络进行训练与检验,其拟合效果如图4-5所示,拟合值也能达到很好的拟合水平。图4-5人工神经网络总体样本拟合效果图(没舍弃异常数据时)0.70.6实际值没去掉异常值时预测值0.50.4NTU0.3浊度0.20.10.0201207201208201209201210201211编号图4-6模型预测结果图(没舍弃异常数据时)将后5组数据当作预测时的数据样本,并运用已经训练好的BP网络对这5组数据的浑浊度进行预测,得到的预测结果如表4-8所示,预测效果图见图4-6。44 苏州科技学院硕士学位论文第四章水质模拟预测表4-8没去掉异常值时浊度实际值和预测值的比较单位:NTU编号实际值没去掉异常值时预测值绝对误差相对误差(%)2012070.360.2345-0.13-34.86112012080.410.44050.037.4390242012090.270.30960.0414.666672012100.280.3790.1035.357142012110.340.48960.15444.4.2舍弃异常数据后模型的拟合和与预测舍弃异常数据后,训练样本变成12组数据,对这12组数据建立模型并进行拟合,然后将后5组数据作为预测阶段的样本进行的预测,运用与4.4.1节相同的方法。浑浊度仍然作为模型的因变量,建立网络神经模型,模型的训练和检验拟合效果图如图4-7和4-8所示,模型的拟合度极好。图4-7人工神经网络训练拟合效果图(舍弃异常数据后)图4-8人工神经网络总体样本拟合效果图(舍弃异常数据后)45 苏州科技学院硕士学位论文第四章水质模拟预测图4-9和表4-9是舍弃异常数据后的预测结果,且表4-9列出了后5组数据的实际值和预测值,并给出了绝对误差和相对误差。0.6实际值0.5去掉异常值后预测值0.4NTU0.3浊度0.20.10.0编号201207201208201209201210201211图4-9模型预测结果图(舍弃异常数据后)表4-9去掉异常值时浊度实际值和预测值的比较单位:NTU去掉异常值后相对误差编号实际值绝对误差预测值(%)2012070.360.40050.0411.252012080.410.42920.024.6829272012090.270.27580.012.1481482012100.280.32410.0415.752012110.340.3179-0.02-6.54.4.3BP网络模型对两种输入样本进行预测的效果比较进行离异数据的取舍后,将取舍的两种数据分别用BP网络模型进行预测,得到的结果见表4-10和图4-10。从图4-10可以看出去掉离异数据后的拟合效果明显比没去掉前好。而且从表4-10中数据表明,舍弃离异数据前,绝对误差最小相差0.03,绝对误差最大相差0.13,相对误差最大为35.36%,最小为7.44%;舍弃离异数据后,绝对误差最小相差0.01,绝对误差最大相差0.04,相对误差最大为15.75%,最小为2.15%,结果说明进行离异数据的检验至关重要。表4-10异常值去除前后模型效果的比较单位:NTU没去掉异常值时相对误差去掉异常值后相对误差编号实际值绝对误差绝对误差预测值(%)预测值(%)2012070.360.2345-0.13-34.86110.40050.0411.252012080.410.44050.037.4390240.42920.024.6829272012090.270.30960.0414.666670.27580.012.1481482012100.280.3790.1035.357140.32410.0415.752012110.340.48960.15440.3179-0.02-6.546 苏州科技学院硕士学位论文第四章水质模拟预测0.8实际值0.7没去掉异常值时预测值0.6去掉异常值后预测值0.5NTU0.4浊度0.30.20.10.0编号201207201208201209201210201211图4-10异常值去除前后模型预测效果的比较4.5两种模型的效果比较表4-11和图4-11是9号监测点的数据利用两种模型所建立的模型应用效果,从应用效果来看,无论是去掉异常值还是不去掉异常值,神经网络模型的精度明显高于多元线性回归。从表4-11中看出,尽管BP人工神经网络总的预测效果良好,可以满足水质管理的要求,但仍存在个别点误差较大的问题,出现部分误差较大的原因可能是因为水质监测数据本身具有很大的随机性,也可能是BP算法自身的一些不足引起。BP算法在运行的过程中需要用大量的的数据来训练神经网络,并且通过对网络参数的不断调整来进一步提高预测精度。虽然BP网络不具有记忆能力,只能保证当前训练的样本点符合精度要求,但是之前训练的点则可能误差很大;也可能使运行陷入局部极小点不能继续收敛的状态。这种状况的解决方法就是扰动权值,能使网络脱离目前局部最小点的状态,有些情况下还需要重新给网络的权值初始化,以提供预测[68]的精度和准确性。尽管BP神经网络存在一些不足,还有待改进,但是实践证明是可以利用此方法对本课题中的水质进行预测的。表4-11两种模型效果的比较单位:NTU多元回归分析BP人工神经网络没去掉异常值去掉异常值编号实际值绝对相对误差预测值绝对相对误差绝对相对误差误差(%)预测值预测值误差(%)误差(%)2012070.360.13308-0.23-63.03330.2345-0.13-34.86110.40050.0411.252012080.410.28273-0.13-31.04150.44050.037.4390240.42920.024.6829272012090.270.0412-0.23-84.74070.30960.0414.666670.27580.012.1481482012100.280.11163-0.17-60.13210.3790.135.357140.32410.0415.752012110.340.1958-0.14-42.41180.48960.15440.3179-0.02-6.547 苏州科技学院硕士学位论文第四章水质模拟预测0.8实际值多元回归0.6神经网络NTU0.4浊度0.20.0编号201207201208201209201210201211图4-11两种模型效果的比较48 苏州科技学院硕士学位论文第五章水质预测模型的误差分析第五章水质预测模型的误差分析将管网模型的预测结果和实测数据进行比较,当预测结果和实测数据基本达到一致,或者达到可以接受的精度时,管网水质模型的校核则结束。因此,必须找到一种合适的校核方法,通过调整模型的参数来减少预测结果和实测值之间的误差,并且发[69]现误差的类型及误差的来源。5.1误差分析图5-1管网示意图表5-11号监测点实际值和预测值的比较单位:NTU多元回归神经网络编号实际值绝对相对误差绝对相对误差预测值预测值误差(%)误差(%)2012070.420.17732-0.25-59.52380.37110.0511.904762012080.350.23721-0.12-34.28570.34280.012.8571432012090.220.05824-0.17-77.27270.2461-0.02-9.090912012100.250.11236-0.13-52.00000.22730.03122012110.320.17623-0.15-46.87500.30310.026.2549 苏州科技学院硕士学位论文第五章水质预测模型的误差分析0.6实际值0.5多元回归神经网络NTU0.40.3浊度值0.20.10.0编号201207201208201209201210201211图5-2两种模型在1号监测点的应用效果本课题是对9号监测点的水质进行检验,并模拟预测。从图5-1可以看出,9号监测点为离水厂较远,其他点基本为中间点,输水管线越长,出厂水受管道的腐蚀影响就会越强,监测到的水质数据偏离也会越大,因此给预测带来的误差也会越大。另外,从图5-1中看出1号监测点比9号监测点离水厂近,1号监测点的输水管段明显不如9号监测点的管段管径大,而且图5-2和表5-1显示1号监测点预测效果却并不理想,这说明预测效果不仅与输水管的长度有关,还和输水管段的管径有关,因此,大管段或离出水口很近的管段,模型的应用效果相对才会较好。最后,结合当今供水管网环状布置的特点,从管网示意图及监测点的分布可以看出,各个监测点上游有几个来水方向,这对监测点的水质影响也会较大,浊度的变化也会更加频繁,模型的运行效果也会受到很大的影响。5.2误差来源(1)测量方法造成的误差。这种误差主要来源于实验的原理中,无法避免的让真实值与实验值之间存在着误差。(2)实验仪器引起的误差。在对水质指标进行监测的过程中,没有及时地对实验仪器进行校核,而且可能实验仪器本身存在误差,这都可能引起实验值和真实值之间的误差。(3)控制指标自身原因引起的误差。本课题中的因变量也就是控制指标是浑浊度,其数值相对于其它指标的数值来说是痕量,也就是极小的量,因此,即使绝对误差很小,但由于实验值本身是极小的痕量,所以相对误差却很高了,这也不可避免的带来了误差。(4)实验数据的样本小、实验数据不足引起的误差。本课题在数据的获取中由于实50 苏州科技学院硕士学位论文第五章水质预测模型的误差分析验条件也因为作者自身的原因,没有充足的数据,相对于数据完善的情况拟合效果没有达到最佳,误差也会由此产生。(5)离异值的是否去除引起的误差。在一组数据中,有某些数据过大或过小,显现出异常的特征,这样的数据不去除将会引起一定的误差,这个在前面的实例应用中已经得到了很好的证明。将去除离异值前后的数据应用于BP神经网络预测模型,运行的效果及误差比较在第四章中的表4-10和图4-10中得到了很好的展示。在水质变化模型的建立及模拟算法的运行和校正过程中,大量详实的数据是模型运行的基础。因此,如何数据准确性的偏离都会使运行结果的准确性不高,[70]会影响模型的最终结果。(6)预测方法选择带来的误差。本课题对回归模型、灰色预测模型、人工神经网络及时间序列模型这四种模型在模拟预测中的优缺点进行了对比,最终选定多元回归模型和人工神经网络模型来模拟预测管网水质。结合最终的模拟预测结果可以看出,尽管回归模型应用简单广泛,适应能力强,但是基于课题给定的数据不够充足完善,所以运行出来的效果不佳、误差较大。神经网络在本课题中的模拟预测效果挺好,可以满足水质管理的要求,但是神经网络的训练检验也是要建立在数据样本大的基础上的,若数据样本足够大,模拟效果可能会更好,预测的误差可能会更小。存在误差是必然的,既然误差不能被消除,但是可以采取一定的措施来减小误差。根据上述所述误差的来源,可以采取如下减小误差的方法:(1)在各项指标的测定过程中,在测量原理固定的情况下,在测量方法上做到严格、准确。(2)对实验仪器定期进行校准,更多地注意仪器的正确使用方法和条件,在操作实验仪器时严格按照实验的步骤,避免对仪器造成损伤。(3)在实验的操作过程中,尽量减少或者是消除因操作时主观上带来的误差;(4)在条件允许的情况下,尽量增加样本容量,提供足够充分的数据,以提高模型的拟合度。(5)对实验数据进行检验,去除异常数据也能很大程度上减小误差。(6)选择更加合理有效的水质建模方法,以减小误差。目前,在我国市政输配水管网系统中,设立合理的水质监测点和采样点,对管网水质实施有效地监测,是建立、校正管网水质变化模拟系统时的基本数据来源,因此,对管网水质的直接监测已成为了供水企业掌握管网水质工况的唯一途径。但我国目前存在的监测站过少、监测数据缺乏的问题,这给水质预测带来极大的困难。因此建立科学的水质监测网,合理、连续稳定地分布布置采样点显得尤为重要。科学地建立水51 苏州科技学院硕士学位论文第五章水质预测模型的误差分析质监测网不仅能确保水质监测数据的实时、有效,而且能提高水质数据的精度和准确性,为水质预测提供科学支撑。52 苏州科技学院硕士学位论文第六章结论与展望第六章结论目前,给水系统中水质的监测、检验评估及控制已经越来越受到各自来水公司的关注,但是由于供水系统的复杂性和庞大性,仅靠人工对有限的监测点进行监测,对整个管网管段水质情况无法实时、全面地进行了解。如果运用计算机技术,建立管网水质监测模型,对监测点的水质情况进行实时观测,并跟踪管网的水质变化情况,不仅可以评估供水系统管网中的水质状况,还能达到提高水质管理水平的目的。6.1主要研究成果本文主要的研究成果:(1)以苏州市某自来水厂管网末梢水质指标监测中的9个监测点为例,采用4D检验模型、Dixon检验模型、Q检验模型、Grubbs检验模型这4种统计学检验模型对监测点的水质数据进行检验,并对检验结果进行分析,对水质监测数据做出了科学的取舍判断,为后期的水质建模和模拟预测提供更好的数据基础。(2)对供水管网水质模型进行了充分的理论研究。现阶段国内外对水质机理模型研究得都相对深入,主要体现对余氯衰减模型、消毒副产物模型和微生物模型的研究上。统计模型虽然使用得广泛、普遍,但却只有在数据充分的情况下才能获得良好的效果。(3)以浑浊度为控制指标,结合多元回归分析和人工神经网络这两种方法来进行模型的拟合,并将模拟出来的模型应用到9号监测点的实例中去,最终对两种模型结果进行比较分析。经比较,神经网络的模拟效果要优于统计回归分析。(4)根据实际数据运行出来的效果,对两种模型的误差来源进行分析,并提出了一些减小误差、提高模型精度的方法。6.2问题与建议(1)本课题采用的是2011年4月到2012年12月这二十个月管网末梢12项水质指标数据,虽然持续时间较长,但由于实验条件和水厂自身的制度,这些指标每个月只监测了一次,因此代表性、持续性不够强;再因为实验过程中产生的误差,使得水质数据的不够准确,这对水质模型的精度和效果都会有较大的影响。53 苏州科技学院硕士学位论文第六章结论与展望(2)作为非软件专业的学生,在短时间内要学会将多元回归分析和人工神经网络应用到管网的水质模型中,虽然通过自身摸索也取得了不错的效果,但因涉及到的数学知识较复杂,在参数设置和运行过程中可能还存在一些问题,需要进一步的完善。(3)本课题只研究了一个控制指标的水质模型,有待于对两个或两个以上控制指标的水质模型进行研究,扩大模型的预测指标,不仅可以对管网水质有一个更加全面的预测,而且还能为提高供水安全提供保障。54 苏州科技学院硕士学位论文参考文献参考文献[1]严煦世.给水工程(第四版)[M].北京:中国建筑工业出版社,1999.[2]王欣,胡文慧.影响管网自来水水质的几点因素[J].黑龙江水利科技,2004,(2):53.[3]陈超.供水管网漏水管理新系统和管道寿命经济决策系统[D].天津:天津大学,2000.[4]俞为荣.给水管道漏损的原因及对策[J].四川建筑,2001,25(2):83-90.[5]王丹宁,赵明,赵洪宾.给水管网水质数据统计学检验模型的建立应用[J].哈尔滨工业大学学报,2007,39(12):1869~1872.[6]孙耕田,王希常,孙金凤,马力.糖尿病分型的数学模型及计算机系统[J].山东师大学报(自然科学版),1991,6(1):15~20.[7]杜启振,侯加根,陆孟基.储层微相及砂体预测模型[J].石油学报,1999,20(2):45~50.[8]刘振峰,郝天珧,杨长春.沉积模型和储层随机建模[J].地球物理学进展,2003,18(3):519~523.[9]张绍周,辛志军,倪竹君等.水泥化学分析[M].北京:化学工业出版社,2007,7.[10]张展,王利生,张培栋等.地理信息系统在秸秆资源化利用中的应用[J].可再生资源,2008,26(6):85~90.[11]包腾飞,秦栋等.混凝土坝裂缝转异监控模型研究[J].中国科学,2011,41(9):1262~1270.[12]史文雷.经管类专业《统计学》教学中应融入数学模型思想[J].职业时空,2012,8(4):66~67.[13]赵洪宾.给水管道内余氯消耗规律的初步研究[J].给水排水,1986,(2):11~15.[14]赵洪宾.给水管网系统理论与分析[M].北京:中国建筑工业出版社,2003.[15]Boulos,P.F.,Altman,T.(1991).“Improvedalgorithmsformodelingwaterqualityincomplexpipedistributionsystems”.ComputerDenver,Colo.[16]吴文燕.给水管网系统水质模型的研究[D].哈尔滨:哈尔滨建筑大学博士学位论文,1999.[17]吴文燕,赵洪宾,解守志.监测配水管网水质[J].中国给水排水,1997,13(1):25~27.[18]李欣,马建薇,袁星.城市给水管网水质研究与进展[J].哈尔滨工业大学学报,2004,36(10):1392~1396.[19]李欣,张继良,王郁萍,赵洪宾.配水管网水质变化的研究(Ⅲ)——三卤甲烷的研究[J],哈尔滨建筑大学学报,2000,33(2):58~61.[20]GraymanWM,ClarkRM,MalesRM,Modelingdistributionsystemwaterquality:dynamicapproach,JWaterResourPlngandMgmt,1998,114(3):295-312.[21]王阳.城市供水管网是指预测模型的研究与应用[D].天津:天津大学硕士学位论文,2005.[22]MaleSRM,ClarkRM,WehrmanPJ,etal,AlgorithmformixingproblemsinwaterSystems,JHydrEngrg,1985,111(2):206-219.55 苏州科技学院硕士学位论文参考文献[23]LiouSCP,KroonJR,Modelingthepropagationofwaterbornesubstancesindistributionnetworks,AWWA,1987,79(11):54-58.[24]RossmanLA,PaulFBoulo,TomAltman,Discretevolume-elementmethodfornetworkwater-qualitymodels,JWaterResourPlngandMgmt,1993,119(5):32-40.[25]ChaudhryMH,IslamMR,Waterqualitymodelinginpipenetworks,Netherland:ImprovingEfficiencyandReliabilityinWaterDistributionSystems,KluwerAeademiePublishers,1995.[26]ChaudhryMH,IslamMR,Waterqualitymodelinginpipenetworks,Netherland:ImprovingEfficiencyandReliabilityinWaterDistributionSystems,KluwerAeademiePublishers,1995.[27]RodriguezMJ,SerodesJB,Assessingempiricallinearandnon-linearmodellingofresidualchlorineinurbandrinkingwatersystems,EnvironmentalModellingandSoftware,1999,14(1),93-102.[28]WindsorSung,BetsyReilley-Matthews,O’DayDkelly,etal,ModelingDBPsformation,JAWWA,2000,92(5):53-63.[29]PiriouSDukan,LeviY,GuyonF,etal,Modelingfreeandfixedbacterialbilomassbehabviorindrinkingwaterdistributionsystems,RevSciEau,1996,(3):381-387.[30]陈炬锋.城市配水管网水质预测模型的研究[D].天津:天津大学硕士学位论文,2007.[31]李家贵,戴健榕.关于可疑值取舍问题的看法[J].玉林师专学报,1997,18(3):62~64.[32]张燕,姜进峰,李翠梅,刘成刚,蒋光洁.4D和Q检验模型在供水管网水质检验中的应用[J].水电能源科学,2012,2(13):50-53.[33]王震宇,雅雪蓉,李凌.水样不溶微小颗粒、溶解性总固体与总放射性水平之间的关系分析[J].中国卫生检验杂志,2010,20(5):1182~1184.[34]中国疾病预防控制中心环境与健康相关产品安全所,广东省卫生监督所.浙江省卫生监督所,等.生活饮用水卫生标准(GB5749-2006)[S].北京:中国标准出版社,2007.[35]JohnJ.Vasconcelos,LewisA.Rossman,WalterM.Grayman,PaulF.BoulosandRobertM.Clark.Kineticsofchlorinedecay,Journal(AmericanWaterWorksAssociation),1997,89(7):54~65.[36]赵志领,赵洪宾,何文杰.天津市给水管网余氯衰减模型研究[J].给水排水,2006,32(5):36~38.[37]钟丹.给水管网余氯衰减规律及影响因素研究[D].哈尔滨:哈尔滨工业大学博士学位论文,2009.[38]郭诗文.管网中基于余氯衰减的三卤甲烷动力学模型研究[D].浙江:浙江大学建筑工程学院硕士学位论文,2008.[39]ClarkRM.ChlorineDemandandTTHMFormationKinetics:ASecond-OrderModel.JWaterResourcePlanningandManagement,1998,124(1):16-24.[40]ClarkRM.,etal..PredictingChlorineResidualsandFormationofTTHMSinDrinkingWaterSystems.JEnvironmentEngineering,1998,124(8):1203-1210.[41]郑晓波.饮用水卤代消毒副产物生成动力学及控制技术研究[D].山西:太原理工大学硕士学位论文,2007.56 苏州科技学院硕士学位论文参考文献[42]J.Milot,M.J.RodriguezandJ.B.Serodes.Modelingthesusceptibilityofdrinkingwaterutilitiestoformhighconcentrationsoftrihalomethanes.JournalofEnvironmentalManagement,2000.60:155-171.[43]PeterJ.Vikesland,KenanOzekinandRichardL.Valentine.Monochloraminedecayinmodelanddistributionsystemwaters.Wat.Res.Vol,2001,35(7):1766-1776.[44]ClarkRM.ChlorineDemandandTTHMFormationKinetics:ASecond-OrderModel.JWaterResourcePlanningandManagement,1998,124(1):16-24.[45]赵志领,赵洪宾,何文杰,高金良,阴沛军,李涛.生长环作用下的给水管网水质特质[N].哈尔滨商业大学学报,2008,24(5):532~538.[46]董晓磊,沈致和.城市给水管网水质研究动态[J].合肥工业大学报,2006,29(9):1155~1158.[47]HoldenB,GreethamM,CrollBT,etal.Theeffectofchanginginterprocessandfinaldisinfectionreagentsoncorrosionandbiofilmgrowthindistributionpipes[J].WaterSciTechnol,1995,32(8):213-220.[48]PercivalSL,KnappJS,EdyveanR,etal.Biofilmdevelopmentonstainlesssteelinmainswater[J].WaterRes,1998,32(1):243-253.[49]董长虹.Matlab神经网络及其应用(第2版)[M].北京:国防工业出版社,2007.[50]许东,吴铮.基于Matalab6.X的系统分析与设计[M].西安:西安电子科技大学出版社,2002.[51]张立明.人工神经网络的模型及其应用[M].上海:复旦大学出版社,1993.[52]邹志红,王学良.BP模型在河流水质预测中的误差分析[J].环境科学学报,2007,27(6):1038-1042.[53]程子峰.环境数据统计分析基础[M].北京:化学工业出版社,2006.[54]唐启义,冯明光.DPS数据处理系统-实验设计,统计分析及数据挖掘[M].北京:科学出版社,2007.[55]王治祯.灰色系统及模糊数学在环境保护中的应用[M].哈尔滨:哈尔滨工业大学出版社,2007.[56]曹永中,周孝德,吴秋平,等.河流水质模型研究综述[J].水力科技与经济,2008,14(3):197-199.[57]宋新山,邓伟.环境数学模型[M].北京:科学出版社,2004.[58]宋新山,邓伟,张琳.MATLAB在环境科学中的应用[M].北京:化学工业出版社,2008.[59]樊敏,顾兆林.非激励性水质模型研究综述[J].环境科学与管理,2009,9(34):63-67.[60]唐启义,冯明光.DPS数据处理系统-实验设计,统计分析及数据挖掘[M].北京:科学出版社,2007.[61]王振龙.时间序列分析[M].北京:中国统计出版社,2000.[62]王燕.应用时间序列分析[M].北京:中国人名大学出版社,2005.[63]王松桂.线性统计模型:线性回归于方差分析[M].北京:高等教育出版社,1999.[64]谢龙汉,尚涛.SPSS统计分析与数据挖掘[M].北京:电子工业出版社,2012.1.57 苏州科技学院硕士学位论文参考文献[65]SPSS中多元回归分析实例解析http://wenku.baidu.com/view/a8eb02f9941ea76e58fa0416.html,2011-02-23.[66]邹志红,王学良.BP模型在河流水质预测中的误差分析[J].环境科学学报,2007,27(6):1038-1042.[67]李如忠.水质预测理论模式研究进展与趋势分析[J].合肥工业大学学报(自然科学版),2006,29(1):26~3[68]莫慧芳,谷爱昱,张新政,张敬春.基于BP神经网络的水质预测方法的研究[J].控制工程,2005,11(5),9~11.[69]StefanH.Maier,RogerS.PowellandCliveA.Woodward.Calibrationandcomparisonofchlorinedecaymodelsforatestwaterdistributionsystem.Wat.Res.Vo1.34,No.8,pp:2301-2309,2000.[70]K.W.Chau,C.ChuntianandC.w.Li.Knowledgemanagementsystemonflowandwaterqualitymodelling.ExpertSystemswithApplication,22(2002):32l-330.58 苏州科技学院硕士学位论文致谢致谢本论文在导师刘成刚教授和李翠梅副教授的悉心指导下终于完成。论文完成期间,导师严谨的治学态度和科学的工作方法给了我极大的帮助和影响,感谢刘成刚老师将我领入研究生的学习阶段;感谢李翠梅老师在我生活学习遇到困难时的帮助,学习上良师般的指导,生活上姐姐般的交心、母亲般的引导。在此,谨向两位导师表示最衷心的感谢。在课题组工作及撰写论文期间,师弟郜阔、龚希博、龙浩、罗贤达及黄锐给予了热情的支持,师妹姚文平及同窗项颂、王雅钰也给予了相当的支持;感谢我的室友和同窗在各方面的帮助与支持,你们的帮助与支持让我可以顺利完成这篇论文,在此向他们表达我的感激之情,并祝他们顺利完成学业。另外也要感谢我的家人,感谢父母对我学业的无限支持与关怀,感谢伴侣对我的包容与理解,感谢所有促进完成学业的正能量。59 苏州科技学院硕士学位论文作者简介作者简介张燕(1986-),女,汉族,湖北监利人。2010年6月毕业于华中科技大学武昌分校城市建设学院给水排水工程专业,获得工学学士学位。2010年9月考入苏州科技学院攻读市政工程硕士学位,师从刘成刚教授和李翠梅副教授,主要研究方向为管网与设备系统优化。参与项目:国家自然科学基金项目(51109153)苏州科技学院校研究生科研创新计划(SKCX11S_025)在校期间发表论文:[1]张燕,姜进峰,李翠梅,刘成刚,蒋光洁.4D和Q检验模型在供水管网水质检验中的应用[J].水电能源科学,2013,31(2):51-53.[2]张燕,李翠梅,刘成刚.基于城市供水管网水质监测技术的水质模型研究[J].黑龙江科技信息,2012,7(20):27.[3]姜进峰,李翠梅,张燕,查巧珍,肖航.农村生活污水一体化处理设备工艺分析[J].湖北农业科学,2012,51(23):5482-5486.[4]姜进峰,李翠梅,张燕.苏州市高新区给水管网水力模型的建立与应用,水电能源科学(已收录).60'