99久久99久久精品免费看蜜桃,亚洲国产成人精品青青草原,少妇被粗大的猛烈进出va视频,精品国产不卡一区二区三区,人人人妻人人澡人人爽欧美一区

首頁 > 文章中心 > 正文

多元線性回歸下環(huán)境監(jiān)測數(shù)據(jù)分析

前言:本站為你精心整理了多元線性回歸下環(huán)境監(jiān)測數(shù)據(jù)分析范文,希望能為你的創(chuàng)作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。

多元線性回歸下環(huán)境監(jiān)測數(shù)據(jù)分析

摘要:目前的環(huán)境實(shí)時監(jiān)測數(shù)據(jù)精度和適用范圍都有一定限制,為此提出并改進(jìn)一種新的環(huán)境預(yù)測模型,用于預(yù)測大氣環(huán)境質(zhì)量,收集6個空氣污染物指標(biāo)和5個相應(yīng)的氣象指標(biāo)并進(jìn)行檢測。研究發(fā)現(xiàn)通過逐步線性回歸優(yōu)化多元線性方程,可以準(zhǔn)確預(yù)測短期大氣環(huán)境質(zhì)量,改進(jìn)后的模型可以相對準(zhǔn)確地預(yù)測未來大氣污染物的質(zhì)量濃度。

關(guān)鍵詞:環(huán)境監(jiān)測;多元線性回歸;數(shù)據(jù)分析;預(yù)測模型

0引言

近年大氣環(huán)境污染嚴(yán)重,大氣環(huán)境污染會直接導(dǎo)致人們生活環(huán)境質(zhì)量下降,影響人體健康,同時會造成巨大的經(jīng)濟(jì)損失[1-3]。目前的大氣環(huán)境監(jiān)測數(shù)據(jù)主要是通過歷史監(jiān)測數(shù)據(jù),對未來大氣環(huán)境質(zhì)量的變化趨勢進(jìn)行預(yù)判,以便更有針對性地對人們生活生產(chǎn)活動進(jìn)行指導(dǎo)[4-5],同時為政府相關(guān)決策和管理部門在相關(guān)制度制定過程中提供科學(xué)依據(jù)[6-8]。目前對大氣環(huán)境質(zhì)量預(yù)測的方法主要包括數(shù)值預(yù)測以及統(tǒng)計預(yù)測,統(tǒng)計預(yù)測以歷史數(shù)據(jù)統(tǒng)計分析為主,結(jié)合未來發(fā)展規(guī)劃。數(shù)值預(yù)測,主要是指利用數(shù)學(xué)模型進(jìn)行計算或仿真。根據(jù)經(jīng)典的劃分方法,數(shù)學(xué)方法可以分為以下3類:第一類是“梯度輸運(yùn)理論”,它假定湍流通量與平均梯度成正比;第二種是以泰勒統(tǒng)計理論為基礎(chǔ)的“湍流統(tǒng)計理論”;第三種是以量綱分析為基礎(chǔ)的“相似理論”。然而數(shù)值預(yù)測的模型精度低于統(tǒng)計預(yù)測[4],且適用范圍有一定的限制[9-10]。因此,本文采用數(shù)據(jù)易獲取且預(yù)測精度高的統(tǒng)計預(yù)測-多元線性回歸方程進(jìn)行大氣環(huán)境預(yù)測分析。

1研究基礎(chǔ)

1.1多元回歸模型

當(dāng)2個或以上自變量和因變量存在線性關(guān)系時,即為多元線性回歸。其數(shù)學(xué)模型[11-12]如式(1):y=a1+a2x1+a3x2+…+am+1xm+ε(1)其中,a1,a2,a3,…,am+1為回歸系數(shù),ε為隨機(jī)誤差?;貧w系數(shù)估計值采用式(2),minQ=∑nt=1[y1-(a1+a2x1t+a3x2t+…+am+1xmt)]2(2)待多元線性回歸方程求出之后,需要對其進(jìn)行檢驗(yàn)以確定其精確度。常用的檢驗(yàn)方法包括相關(guān)系數(shù)檢驗(yàn)、F檢驗(yàn)和t檢驗(yàn)[13]。(1)相關(guān)系數(shù)檢驗(yàn)相關(guān)系數(shù)是用來衡量線性模型擬合程度的指標(biāo),數(shù)學(xué)表達(dá)式是回歸平方和占總平方和的比值,如式(3):R2=SSR/pSST/n-p-1(3)(2)F檢驗(yàn)F檢驗(yàn)用來檢驗(yàn)線性模型中自變量和因變量之間的關(guān)系是否顯著,如式(4):(3)t檢驗(yàn)通過t檢驗(yàn)可以決定作為某一變量是否作為自變量保留在模型中,如式(5):式(3)~式(5)中,SST表示因變量觀測值和均值的差異的偏差平方和,SSR是由自變量引起的偏差,即回歸平方和,SSE是實(shí)驗(yàn)誤差等引起的剩余平方和,其關(guān)系如式(6):

2數(shù)據(jù)采集與處理

2.1數(shù)據(jù)采集

根據(jù)GB3095—2012標(biāo)準(zhǔn)對大氣環(huán)境質(zhì)量進(jìn)行評價。對PM2.5、PM10、CO、SO2、O3以及NO2共6項(xiàng)污染物指標(biāo)進(jìn)行監(jiān)控。例如在監(jiān)測現(xiàn)場,共有23000個PM10質(zhì)量濃度數(shù)據(jù),其中20000個用作訓(xùn)練數(shù)據(jù),3000個用作測試數(shù)據(jù)。此外,溫度、濕度、風(fēng)速、風(fēng)向、氣壓等氣象條件會通過影響污染物在大氣環(huán)境中的擴(kuò)散而影響大氣環(huán)境質(zhì)量,如高濕度會加劇空氣污染程度。因此,本文收集6個空氣污染物指標(biāo)和5個相應(yīng)的氣象指標(biāo)。

2.2數(shù)據(jù)處理

根據(jù)每個大氣數(shù)據(jù)合理分布范圍和相互關(guān)系,檢查數(shù)據(jù)是否存在異?;蚧ハ嗝艿臄?shù)值,將異常數(shù)據(jù)進(jìn)行剔除。另外采集到的數(shù)據(jù)可能存在無效或缺失的情況,采用變量平均值進(jìn)行估算補(bǔ)充。為減小大氣監(jiān)測數(shù)據(jù)之間量級、量綱的差異而導(dǎo)致的預(yù)測模型精確度下降的情形,對數(shù)據(jù)進(jìn)行歸一化處理。歸一化至[0,1]區(qū)間,設(shè)xmax和xmin分別代表原始數(shù)據(jù)最大和最小值,xi為實(shí)際數(shù)據(jù),xi表示歸一化之后的數(shù)值,歸一化計算式為之后采用計算式xi=(xmax-xmin)xt+xmin換算出輸出值。

3預(yù)測模型

3.1傳統(tǒng)多元線性回歸預(yù)測模型

將預(yù)處理過的數(shù)據(jù)構(gòu)造出多元線性回歸模型,并進(jìn)行相關(guān)系數(shù)檢驗(yàn)、F檢驗(yàn)和t檢驗(yàn)。之后將預(yù)測結(jié)果和測試數(shù)據(jù)進(jìn)行對比。因變量是PM10,自變量是溫度、氣壓等5項(xiàng)氣象數(shù)據(jù),建模方法是全部輸入。(1)相關(guān)系數(shù)檢驗(yàn)結(jié)果如表1所示,R2代表擬合效果,其值越大,說明擬合效果就越好。(2)F檢驗(yàn)結(jié)果如表2所示。從表2可以看出,F檢驗(yàn)結(jié)果小于0.01。因此5項(xiàng)氣象指標(biāo)對PM10質(zhì)量濃度具有顯著的影響。(3)t檢驗(yàn)結(jié)果如表3所示。非標(biāo)準(zhǔn)化系數(shù)用于列出回歸方程。標(biāo)準(zhǔn)化系數(shù)用來表示自變量對因變量的影響程度;偏回歸系數(shù)用來判斷某一自變量對因變量的影響是否有統(tǒng)計意義,當(dāng)其小于0.05時,具有顯著的統(tǒng)計意義;當(dāng)小于0.01時,統(tǒng)計學(xué)意義非常顯著。(4)預(yù)測模型線性回歸方程為:y=-3.796×1-1.296×2+2.223×3-55.059×4-0.207×5+398.212真實(shí)值和預(yù)測數(shù)據(jù)對比如圖1所示。

3.2改進(jìn)的多元線性回歸預(yù)測模型

考慮到污染物質(zhì)之間存在物理化學(xué)反應(yīng),同時季節(jié)因素對污染物也有重要的影響。因此,將其他污染物和季節(jié)因素一并納入多元方程進(jìn)行優(yōu)化。季節(jié)變量取值為:春季108.1μg/m3,權(quán)重0.25;夏季97.8μg/m3,權(quán)重0.2;秋季112.3μg/m3,權(quán)重0.25;冬季121.9μg/m3,權(quán)重0.3。通過將自變量逐個引入回歸模型,進(jìn)行顯著性檢驗(yàn),直至所有顯著自變量均被引入回歸模型。逐步回歸模型結(jié)果如表4所示。從表4可以看出,PM2.5對PM10的影響最大,而大氣污染物SO2、NO2、CO以及氣象因素風(fēng)向?qū)Γ校停保暗挠绊懣珊雎?,因此將這幾項(xiàng)指標(biāo)刪除后,得表5。得回歸方程:y=30.304×1+19.729×2-0.359×3+8.541×4+0.897×5+5.184×6+10.280×7-90.087采用該模型,所得真實(shí)值與預(yù)測值如圖2所示。從圖2可以看出,優(yōu)化后的模型,擬合度達(dá)到0.828,比原始模型明顯提高,說明采用逐步線性回歸方式,將氣象因素以及其他污染物質(zhì)一并考慮之后,對PM10的預(yù)測將更加準(zhǔn)確。此外,從圖2也可以看出,短期的預(yù)測誤差最小。同時,PM2.5、風(fēng)速、氣壓、濕度和季節(jié)對PM10質(zhì)量濃度有增強(qiáng)作用。PM2.5對PM10的影響最大,O3和溫度對PM10的影響有所減弱。2種預(yù)測模型效果對比如表6所示。

4總結(jié)

本文分別采用原始多元線性回歸模型以及優(yōu)化后的模型,分別對大氣環(huán)境質(zhì)量進(jìn)行預(yù)測,得出如下結(jié)論。(1)傳統(tǒng)多元線性回歸模型只能相對粗略地預(yù)測大氣環(huán)境質(zhì)量變化趨勢,而其改進(jìn)模型能夠相對準(zhǔn)確地對未來大氣污染物質(zhì)量濃度進(jìn)行預(yù)測。(2)采用逐步線性回歸方式將氣象因素以及其他污染物質(zhì)一并考慮能夠更加準(zhǔn)確地對PM10進(jìn)行預(yù)測,且對短期內(nèi)的預(yù)測誤差最小。

作者:翟維 單位:西安航空學(xué)院