城市供水安全事關人民群眾的切身福祉,事關城市的健康安全運行。“十三五”水專項課題“城市供水全過程監管平臺整合及業務化運行示范”,在前期關鍵技術研究的基礎上,探索綜合運用物聯網、云計算、大數據、移動互聯網等先進信息化技術手段,整合形成了城市供水系統監管業務平臺,并在山東、河北、江蘇等省推廣應用,支撐了國家供水應急救援基地的監控管理和應急調度,實現了“由單一水質管理到供水全過程綜合監管”的功能擴展和“由技術平臺到業務平臺”的技術提升。下一步,課題將著力加強成果驗證與應用擴散,按照功能完善、結構穩定、運行高效、總體安全的總體要求,不斷完善城市供水系統監管平臺構建的各項技術,為提升我國城市供水全過程的信息化監管能力提供全面技術支撐。
1 城市供水監管信息化的發展現狀
改革開放以來,我國城市供水能力和供水質量不斷提高,現已建成規模龐大的供水設施,根據《中國城市建設統計年鑒(2017年)》數據顯示,全國已建成城市公共供水廠約2 880個。近年來,我國各地按照相關政策法規的要求,開展了城市供水水量、水質、水壓等監測能力的建設,具備了一定的供水安全監管能力。伴隨著在線監測手段和信息處理技術的發展,我國地方政府和城市供水單位對于革新供水行業的傳統監管方式、提高供水監管的自動化和智能化水平,表現出了濃厚興趣,“智慧水務”建設在各地蓬勃開展。
“十一五”和“十二五”期間,通過水專項課題的開展,初步建立了國家、省、市三級的城市供水水質監測預警系統技術平臺。但一方面當前供水監管中存在實測指標不全面、監測頻率不達標、風險預警不及時等問題,另一方面仍有部分地區的供水運營管理相關業務是以現場經驗判斷、手動操作、人工報數等傳統手段為主,大中城市供水單位每日積累的海量供水數據所包含的信息幾乎尚未被挖掘利用。據初步統計,我國直轄市、計劃單列市、省會城市等36個重點城市的130多個公共供水廠,每年積累的水質信息就多達1 350萬余條。當前供水大數據所蘊藏的信息利用潛能已越來越為業內所共識,部分城市供水單位開始利用供水大數據開展了漏損控制、管網健康度評價管理等工作。國外一些供水單位對供水數據的應用也進行了一些探索,例如英國聯合水務用供水數據預測未來用水量,從而提前做好生產預案;荷蘭的vitens公司針對管網建立了預警系統可以在2 min內識別爆管事件;歐盟資助的智慧水務項目也在研究根據用戶用水習慣預測未來用水量和消費趨勢等。
當前我國各地的供水監管信息化水平雖有差異,但信息化建設進程正在提速發展。“十三五”期間,依托“城市供水全過程監管平臺整合及業務化運行”課題,多家供水單位在建成了業務應用系統模塊基礎上,正在探索進一步提高信息應用效率、提高監管水平。
2 城市供水大數據的獲取來源
2.1 內部來源
2.1.1 統計報表數據
一是可從城市供水單位、水質檢測機構等單位獲取水質數據,包括水源水、水廠各工藝段進出水、出廠水、管網水、二次供水、龍頭水等環節的水質檢測數據;二是可從城市供水單位獲取生產數據,包括設施資產、設備工況、材料庫存、售水情況、供水用戶信息、供水管網信息、設備維護檢修記錄、服務投訴信息等。
2.1.2 設備自動監測數據
一是可從城市供水主管部門和城市供水單位收集獲取設備自動監測數據,包括在線采集的水量、水位、水質等實時數據;二是可從城市供水單位獲取現場作業數據,包括員工通過移動設備人為實時遠傳的地理位置、供水用戶水量、事故特征、現場照片、視頻等數據。
2.2 外部來源
除了獲取城市供水系統內各部門數據,還可從環保、水利、氣象、衛生健康等相關部門獲取與城市供水相關的水質、水文、氣象等數據。
此外,在不影響被訪問的網站正常運行的前提下,采用符合法律、法規的方式,例如網絡爬蟲等技術,可獲取政府機構、企業等組織提供的與供水服務有關的免費開放數據,包括供水水質信息公開數據、供水事故信息、人口數據、建筑信息數據等。
3 大數據在城市供水監管中的典型應用場景及實踐案例
3.1 水源和水廠大數據應用
3.1.1 水質風險關鍵指標篩選
在水質日常監測、風險預警和管控過程中,通過對水源、水廠,以及輸配水過程中的水質指標及其環境類指標進行相關性分析,找出不同水質指標之間、水質指標與其它環境類指標之間的內在關聯性,可篩選出水質風險關鍵指標。
以篩選可預測水源水體富營養化的水質預警指標為例,山東省城市供排水水質監測中心對某市水庫近5年的原水水質月檢數據進行了整理分析,包括溶解氧、總磷、總氮、氨氮、硝酸鹽(以n計)、氮磷比、ph、渾濁度、葉綠素a等9項水質指標。皮爾森相關系數計算結果顯示,原水中葉綠素a與硝酸鹽、總氮、ph、總磷、氮磷比、氨氮濃度存在顯著相關性。進一步分析發現,氨氮和磷元素是水源水中藻類增長最重要的限制因素。因此,初步篩選將ph、總磷和氨氮指標納入預測水源水體富營養化趨勢的預警指標。
3.1.2 水質風險預警模型建立
以歷史水質數據、相關水文及環境類等數據為基礎,通過應用各類數據特征挖掘與分析技術,構建時間序列、回歸分析等風險評估模型,可對水質指標的未來數值和風險進行預測,通過單點閾值、多點聯動等方式進行水質風險預警。
以預測原水高錳酸鹽指數超標風險為例,山東省城市供排水水質監測中心為做好水質風險預警,根據2012年5月~2016年2月的高錳酸鹽指數月檢數據,預測未來一段時間的高錳酸鹽指數月度平均值。根據數據波動特征,選擇指數平滑法模型進行分析,預測結果顯示2016年3~8月的高錳酸鹽指數月均濃度不存在超標風險。
3.1.3 水廠運行工藝調整輔助決策
通過分析原水關鍵水質指標在工藝流程中的變化情況,并對工藝運行參數如藥耗、濾池反沖洗周期、排泥周期等,以及出水水質情況同步分析,可基于不同進出水水質條件下的運行工況和水質預警結果構建工藝調整輔助決策模型。當面臨水源地水質突變、水廠藥耗增加等相關參數變化問題時,可將相關信息作為輸入參數,利用輔助決策模型模擬出水情況,從而避免了人為判斷的主觀性。此外,輔助決策模型也可預測出水水質達標條件下對應的水源地水質預警值及工藝藥耗最小值。
北京首創股份有限公司在經營華北某水廠時,為了提前準備工藝預案,基于2014~2017年實測的進出水水質數據和記錄的運行工況數據,建立“水源地水質/水量-水廠藥耗-出水水質”在不同區間下一一對應的關聯性,并采用人工神經網絡技術建立了工藝調整輔助決策模型。模型的輸入值主要包括進水條件(溫度、ph)、水源地水質(渾濁度、色度、高錳酸鉀指數、細菌總數)、進水水量及藥品投加量(聚合氯化鋁投加量、加氯量),輸出值為經凈水工藝處理后的對應出廠水質。通過改變不同的工況條件,可準確快捷地預測得到對應的出水水質,并可同步計算所實現的污染物去除率,同時可反推在出水水質達標要求下,進水條件或各工況工藝參數的預警值。
3.2 供水管網大數據應用
在明確供水管網運行事故具體評價對象前提下,根據供水管網大數據,可建立模型對供水管網的運行事故評價指標發生概率進行定量預測。進一步結合管道級別、道路等級、人口密度等因素,可通過構建定量判別指標體系和評判標準,評估管道風險影響程度,從而明確管道修復/更新改造的優先級,科學劃定供水管網修復/更新改造的范圍。
以評估供水管網運行風險為例,深圳市水務(集團)有限公司選擇爆管風險作為供水管網運行風險的評估指標,選取管材、管徑、管齡、道路負荷、運行壓力、雜散電流、是否發生破損等影響因子,采用隨機森林模型構建了供水管網爆管風險評估模型,取得了較好的預測結果(見圖2),以該數值的大小來量化評價供水管網運行風險,并作為制定供水管網更新改造計劃的重要數據參考。
利用供水大數據開展管網漏損控制也是當前的熱點應用之一。伴隨著住建部《城鎮供水管網分區計量管理工作指南——供水管網漏損管控體系構建(試行)》等相關政策文件的出臺,基于分區計量管理的漏損控制在北京、上海、鄭州等多個城市得以推廣應用。
3.3 供水用戶服務信息大數據應用
3.3.1 公眾反饋供水問題熱詞與熱圖解析
以公眾反饋的供水客服、網絡輿情等數據作為數據應用的核心,通過解析問題熱詞和熱圖,可精準掌握服務痛點問題與公眾輿情。進一步結合與之相關的生產、營銷等數據,開展問題溯源,可為改進服務提供決策參考依據。
以改進水質投訴問題為例,濟南水務集團有限公司發現2016年10~12月間,水質投訴類客服工單數量增加明顯。通過篩選統計高頻詞匯,并根據文本語義與組織結構進行最小串分詞,選取高頻排序優先的關鍵詞構建出熱詞庫,發現高頻熱詞為龍頭水有異味。將所有涉及龍頭水有異味數據的發生地點進行數據抽取,發現所涉及地點圍繞某道路周邊沿線分布,初步判定投訴問題與該道路對應供水廠的出廠水水質或其原水水質相關。進一步的相關性分析結果顯示,原水的藻類物質濃度與龍頭水有異味數據條目數量存在顯著相關性(相關系數為0.969)。溯源調查發現,2016年10~12月,南水北調原水注入了水源地水庫,導致水庫水體藻類物質濃度急劇升高,并分解產生了嗅味物質,造成水體異味增加。經此分析,供水單位在外水注入水庫之際,增加了對藻類指標的檢測,提前制定生產預案控制水質異味,減少了此類問題的投訴率。
3.3.2 供水用戶用水行為分析
以供水客服數據中的供水用戶信息數據與供水管網末端小區二次供水數據為基礎,結合其它相關數據,采用適當的數據挖掘技術,可構建二次供水泵房指標變量時間序列,繼而對不同序列之間的指標變量的趨勢性、周期性及其隨機性進行相關相異分析,在此基礎上總結得出該序列所代表小區用水行為變化趨勢。
為優化供水管網末端的壓力調度、改善客戶服務質量,濟南水務集團有限公司以供水用戶信息與2018年的二次供水生產數據為基礎,結合與之相關的其它業務數據,分析了不同小區之間的用水量變化特征。以其中2座泵房為例,泵房a所在小區建成于2004年、泵房b所在小區建成于2011年,兩座泵房設備運行狀態良好,在線儀表經過校準,且上游供水水廠相同、上級加壓站相同。分析發現,泵房a實時流量最高值多出現在0時,18時,7時,9時,10時,15時,16時,最低值多出現在5時,23時,2時,全天用水無明顯高峰;泵房b實時流量最高值多出現在0,22,7時,最低值多出現在6時,23時,3時,用水量的峰谷波動明顯。結合小區業主用戶平均年齡(泵房a所在小區平均48.5歲,泵房b所在小區平均38.3歲),推斷出泵房a所在小區,由于成年人,尤其老年人較多,用水無明顯高峰;泵房b所在小區,由于青壯年、學前及義務教育階段適齡人群較多,導致出現晨間與晚間用水高峰時間的波動。根據不同小區之間供水用戶平均年齡、小區位置、小區建造時間等因素,針對性地定性溯源用水行為特征產生原因,從而為提前做好客戶服務預案和供水調度決策提供了數據支撐。
4 結語
針對當前城市供水監管中存在的信息化水平較低、數據價值挖掘不足等問題,基于大數據分析中的數據挖掘和綜合評價等技術,利用相關性分析、隨機森林、神經網絡等數據分析算法,可對城市供水大數據潛在信息進行提取分析,開展大數據技術在供水安全動態監管與風險預警領域的應用。
來源:給水排水