摘要:售電量預(yù)測(cè)是電網(wǎng)建設(shè)規(guī)劃的重要依據(jù),由于售電量的變化和發(fā)展受到多種不確定因素影響,傳統(tǒng)的方法難以取得滿意的預(yù)測(cè)效果,因此亟待提出預(yù)測(cè)精度高、穩(wěn)定性好的預(yù)測(cè)方法。對(duì)此,本文提出一種多模型融合預(yù)測(cè)方法,綜合了各種基本預(yù)測(cè)方法在不同條件下預(yù)測(cè)結(jié)果的精度,并將這些信息融合在一起得到最終售電量預(yù)測(cè)值,該方法在提高售電量預(yù)測(cè)結(jié)果精度的同時(shí),又可以保證預(yù)測(cè)誤差的穩(wěn)定性。運(yùn)用本文所提方法對(duì)某市實(shí)際月售電量進(jìn)行預(yù)測(cè),結(jié)果表明,該方法能對(duì)月售電量作較高精度的預(yù)測(cè),并具有強(qiáng)的適應(yīng)能力。
關(guān)鍵詞:售電量;多模型融合;預(yù)測(cè)
0、引言
隨著我國電力行業(yè)的快速發(fā)展,電力系統(tǒng)中對(duì)售電量預(yù)測(cè)的要求越來越高。 正確預(yù)測(cè)出地區(qū)銷售電量的水平,為電力企業(yè)提供營(yíng)銷決策支持,對(duì)于指導(dǎo)發(fā)電廠、輸配電網(wǎng)的合理運(yùn)行,推動(dòng)電力市場(chǎng)的發(fā)展和建設(shè)都具有十分重要的意義。
常用的預(yù)測(cè)方法很多,基本上分為傳統(tǒng)預(yù)測(cè)法與智能預(yù)測(cè)法兩類。傳統(tǒng)預(yù)測(cè)方法主要有經(jīng)驗(yàn)法、回歸分析法[1]、灰色預(yù)測(cè)法[2]、時(shí)間序列法[3]、指數(shù)平滑法等。智能預(yù)測(cè)方法主要包括有小波分析預(yù)測(cè)法、混沌預(yù)測(cè)法、模糊理論預(yù)測(cè)法、人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法、支持向量機(jī)預(yù)測(cè)法[4]等。但是單一方法的應(yīng)用都有其局限性,傳統(tǒng)預(yù)測(cè)方法對(duì)不同類型的售電量預(yù)測(cè)沒有統(tǒng)一而合理的處理方法,在氣候條件、節(jié)假日等影響下穩(wěn)定性較差;智能預(yù)測(cè)算法由于影響售電量變化的眾多隨機(jī)因素很難用數(shù)學(xué)模型描述,也給預(yù)測(cè)的準(zhǔn)確性帶來了一定困難。因此,采用多種數(shù)學(xué)方法融合技術(shù),充分運(yùn)用不同算法各種的優(yōu)勢(shì),取長(zhǎng)補(bǔ)短,融合形成精確的、穩(wěn)定的售電量預(yù)測(cè)系統(tǒng)。
多模型融合預(yù)測(cè)方法是一種對(duì)多種單一預(yù)測(cè)模型進(jìn)行加權(quán)求和預(yù)測(cè)的方法。就一種預(yù)測(cè)方法而言,在不同的條件下、不同類型的售電量預(yù)測(cè)精度高低不一。對(duì)多種預(yù)測(cè)方法來講,在相同的條件和同類型的售電量預(yù)測(cè)中,各模型的預(yù)測(cè)結(jié)果有很大差異。綜合考慮各種基本預(yù)測(cè)方法在不同條件下預(yù)測(cè)結(jié)果的精度,并將這些信息融合在一起,既可以提高售電量預(yù)測(cè)結(jié)果的精度,又可以保證預(yù)測(cè)誤差的穩(wěn)定性。本文提出采用Logistics回歸分析、ARIMA模型和支持向量機(jī)回歸模型作為基本預(yù)測(cè)方法進(jìn)行融合,研究對(duì)月售電量的預(yù)測(cè)。
1、多模型融合的售電量預(yù)測(cè)方法
月售電量受經(jīng)濟(jì)發(fā)展、產(chǎn)業(yè)結(jié)構(gòu)變化、季節(jié)變化等因素的影響,使其呈現(xiàn)出明顯的趨勢(shì)性、季節(jié)周期性以及隨機(jī)性。
月售電量是具有趨勢(shì)性、季節(jié)性和隨機(jī)性的非平穩(wěn)負(fù)荷,直接預(yù)測(cè)難度較大,并且針對(duì)應(yīng)用單一預(yù)測(cè)模型的預(yù)測(cè)精度和穩(wěn)定性不高的問題,運(yùn)用數(shù)據(jù)融合技術(shù)建立一種多模型融合預(yù)測(cè)方法。
1.1、ARIMA模型預(yù)測(cè)方法
ARIMA模型是指將非平穩(wěn)時(shí)間序列轉(zhuǎn)化為平穩(wěn)時(shí)間序列,然后將因變量?jī)H對(duì)它的滯后值以及隨機(jī)誤差項(xiàng)的現(xiàn)值和滯后值進(jìn)行回歸所建立的模型[5]。包括移動(dòng)平均過程(MA)、自回歸過程(AR)、自回歸移動(dòng)平均過程(ARMA)以及ARIMA過程[6]。
結(jié)合ARIMA模型定義,可得月售電量序列

的ARIMA(p,d,q)模型為:
式中:

為月售電量序列;d為差分次數(shù);B為滯后算子;

為月售電量序列經(jīng)過d次差分后形成的平穩(wěn)序列;

為自回歸系數(shù),p為自回歸階數(shù);

為移動(dòng)平均系數(shù),q為移動(dòng)平均階數(shù);

為均值為0,方差為

的白噪聲序列;c為常數(shù);
對(duì)

建立ARIMA模型及預(yù)測(cè)步驟如下所示:
Step1:平穩(wěn)性檢驗(yàn)。用ADF檢驗(yàn)法對(duì)

的

階差分序列依次進(jìn)行平穩(wěn)性檢驗(yàn),直到序列平穩(wěn),確定此時(shí)對(duì)應(yīng)的差分次數(shù)d。一般情況

。
Step2:模型定階(確定階數(shù)p和q)。以自相關(guān)系數(shù)和偏自相關(guān)系數(shù)為基礎(chǔ),根據(jù)這兩個(gè)統(tǒng)計(jì)量的截尾與拖尾性質(zhì)[7]確定ARIMA模型階數(shù)p和q,其確定方法為下表1-1所示。
表1-1 模型定階方法
Step3:參數(shù)估計(jì)。用最小二乘法估計(jì)模型(2)中除了P、d、q以外的其他參數(shù):c、

和

。
Step4:模型檢驗(yàn)。檢驗(yàn)所建模型的殘差序列

是否為白噪聲序列。這一過程仍以自相關(guān)系數(shù)和偏自相關(guān)系數(shù)為基礎(chǔ)。若在

期滯后的自相關(guān)和偏自相關(guān)系數(shù)均趨于0,表明該殘差序列為白噪聲序列,轉(zhuǎn)步驟5;否則,為非白噪聲序列,返回步驟2重新構(gòu)建模型。
Step5:預(yù)測(cè)。得到合適模型后,應(yīng)用模型(2)預(yù)測(cè)月售電量。
1.2、支持向量機(jī)回歸模型預(yù)測(cè)方法
支持向量機(jī)回歸(Support Vector Regression,SVR)算法是基于Mercer核展開定理,是支持向量機(jī)用于回歸中的情況。支持向量機(jī)的基本原理是尋找一個(gè)既能將樣本無誤分開,又能使分類間隔(Margin)最大的最優(yōu)分類線,如圖1-1中H所示。對(duì)于樣本非線性可分的情況,可先通過非線性變換將輸入變量x映射到一個(gè)高維空間(Hilbert空間)中,在高維空間中進(jìn)行分類運(yùn)算,得到最優(yōu)分類面,從而將樣本無錯(cuò)誤分開。支持向量機(jī)根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋找最佳折衷,使得結(jié)構(gòu)風(fēng)險(xiǎn)最小化,以獲得最好的學(xué)習(xí)泛化能力。因此,該方法能夠較好地解決小樣本、非線性、高維數(shù)問題,常被用于識(shí)別[8]和預(yù)測(cè)[9]。
圖1-1 最優(yōu)分類面示意圖
通過構(gòu)造損失函數(shù),并基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化思想,支持向量機(jī)通常采用以下極小化優(yōu)化模型來確定回歸函數(shù)[10],即:
(1)

(2)
式中:

為權(quán)值向量;

為模型復(fù)雜性的表達(dá)項(xiàng);C為平衡系數(shù);

為松弛因子;

是將數(shù)據(jù)映射到高維空間的非線性變換;

為偏置;

為誤差上限。
引入Lagrange乘子

和

,式(1)與式(2)所示的優(yōu)化模型可轉(zhuǎn)化為以下對(duì)偶優(yōu)化問題求解:
求解上述問題可得到支持向量機(jī)回歸函數(shù):

稱為核函數(shù),需滿足Mercer條件,選取高斯RBF核函數(shù)[11],為:
在支持向量機(jī)計(jì)算過程中涉及到兩個(gè)參數(shù),即:權(quán)重系數(shù)C和核函數(shù)參數(shù)g。本文采用網(wǎng)格搜索法進(jìn)行優(yōu)化[12]。
1.3、多模型融合預(yù)測(cè)方法
1.3.1、融合模型的建立
電力企業(yè)售電量受經(jīng)濟(jì)發(fā)展、產(chǎn)業(yè)結(jié)構(gòu)變化、季節(jié)變化等因素的影響,使其呈現(xiàn)出明顯的趨勢(shì)性、季節(jié)周期性以及隨機(jī)性,因此,對(duì)月售電量的預(yù)測(cè),單獨(dú)使用某種預(yù)測(cè)方法直接預(yù)測(cè)難度較大,很難得到比較理想的結(jié)果。所以綜合考慮各種預(yù)測(cè)模型的預(yù)測(cè)結(jié)果,以不同預(yù)測(cè)模型的輸出結(jié)果為信息源,以提高預(yù)測(cè)精度為目的,運(yùn)用數(shù)據(jù)融合技術(shù)對(duì)月售電量預(yù)測(cè)方法進(jìn)行研究[13]。
對(duì)月售電量進(jìn)行預(yù)測(cè)時(shí),若能依據(jù)在前幾個(gè)時(shí)段內(nèi)各種預(yù)測(cè)方法的預(yù)測(cè)效果,實(shí)時(shí)調(diào)整融合預(yù)測(cè)模型中各種預(yù)測(cè)方法的權(quán)重系數(shù),就能夠改善預(yù)測(cè)結(jié)果的精度和穩(wěn)定性。前幾個(gè)時(shí)段內(nèi),預(yù)測(cè)誤差較小的預(yù)測(cè)方法在下一個(gè)時(shí)段內(nèi)的融合預(yù)測(cè)模型中所占的權(quán)重就大;反之,在下一時(shí)段內(nèi)的融合預(yù)測(cè)模型中所占的權(quán)重就小。這種融合預(yù)測(cè)模型不僅可以提高交通流參數(shù)預(yù)測(cè)的精度,還可以保證預(yù)測(cè)的穩(wěn)定性。多模型融合預(yù)測(cè)算法計(jì)算流程如圖1-2所示。
圖1-2 多模型融合預(yù)測(cè)算法計(jì)算流程
多模型融合預(yù)測(cè)方法的預(yù)測(cè)過程主要有如下幾個(gè)步驟:
Step1:預(yù)測(cè)方法的選擇:根據(jù)預(yù)測(cè)方法的預(yù)測(cè)效果以及適用條件等,選擇n種被廣泛使用的比較成熟的預(yù)測(cè)方法作為融合預(yù)測(cè)方法的基本方法。本文將選用時(shí)間序列和支持向量機(jī)回歸作為融合預(yù)測(cè)方法的基本方法。
Step2:基礎(chǔ)預(yù)測(cè)方法進(jìn)行預(yù)測(cè):利用步驟Step1中選擇的每一種預(yù)測(cè)方法對(duì)需要預(yù)測(cè)的月售電量分別進(jìn)行單獨(dú)預(yù)測(cè)。預(yù)測(cè)后將會(huì)得到n個(gè)預(yù)測(cè)方法的預(yù)測(cè)值,即

。
Step3:確定融合預(yù)測(cè)方法中各基本預(yù)測(cè)方法的權(quán)重系數(shù): 各種基本預(yù)測(cè)方法在融合預(yù)測(cè)方法中的權(quán)重大?。?img src="http://www.yy8811.cn/skin/ht01skin/image/lazy.gif" class="lazy" original="http://www.yy8811.cn/file/upload/201807/19/155435122189.png" alt="" />)是根據(jù)各種基本預(yù)測(cè)方法在前幾個(gè)時(shí)段內(nèi)的預(yù)測(cè)精度來確定的。權(quán)重確定的原則是精度越高,權(quán)重越大。
Step4:多個(gè)基本預(yù)測(cè)結(jié)果融合:在t時(shí)段,將各種基本預(yù)測(cè)方法的預(yù)測(cè)結(jié)果

依據(jù)權(quán)重系數(shù)

進(jìn)行加權(quán)融合,就可以得到融合預(yù)測(cè)方法的預(yù)測(cè)結(jié)果

,計(jì)算公式為:
1.3.2、權(quán)重系數(shù)的確定
在融合預(yù)測(cè)方法中,某一基本預(yù)測(cè)方法的權(quán)重系數(shù)決定了該方法輸出的預(yù)測(cè)值對(duì)最終預(yù)測(cè)結(jié)果所起的作用。事實(shí)上,隨著季節(jié)和天氣溫度的變化,每一種基本預(yù)測(cè)方法的預(yù)測(cè)精度均會(huì)發(fā)生不斷的變化,所以融合預(yù)測(cè)方法中各個(gè)基本預(yù)測(cè)方法的權(quán)重系數(shù)也應(yīng)該進(jìn)行不斷調(diào)整,為此引入動(dòng)態(tài)誤差的概念。
動(dòng)態(tài)誤差

定義為:
式中:

是i方法在t時(shí)段的動(dòng)態(tài)誤差,它是t之前m個(gè)時(shí)段內(nèi)i方法的誤差

的均值;m是誤差累計(jì)數(shù);

是t時(shí)段i方法預(yù)測(cè)結(jié)果的絕對(duì)相對(duì)誤差。

的計(jì)算公式為:
式中:

為t時(shí)刻的實(shí)測(cè)數(shù)據(jù);

為i方法在t時(shí)刻的預(yù)測(cè)值。
權(quán)重系數(shù)

與動(dòng)態(tài)誤差

成反比例變化,即動(dòng)態(tài)誤差較大的預(yù)測(cè)方法給予一個(gè)較小的權(quán)重系數(shù),動(dòng)態(tài)誤差較小的預(yù)測(cè)方法給予一個(gè)較大的權(quán)重系數(shù)。首先,我們通過反比例法得到初始權(quán)重系數(shù)

,計(jì)算公式為:
各基本預(yù)測(cè)模型在融合預(yù)測(cè)模型中的最終權(quán)重系數(shù)為:
2、實(shí)例分析
2.1、案例數(shù)據(jù)描述
為了檢驗(yàn)多模型融合預(yù)測(cè)模型的可行性,選取A市2008年1月至2012年12月共60個(gè)月度售電量數(shù)據(jù)作為模型的原始數(shù)據(jù),并用2013年1—12月的數(shù)據(jù)作為驗(yàn)證數(shù)據(jù),然后將預(yù)測(cè)結(jié)果和實(shí)際值進(jìn)行比較,求出誤差評(píng)價(jià)指標(biāo)進(jìn)而驗(yàn)證模型的有效性。A市是我國的經(jīng)濟(jì)發(fā)達(dá)城市,根據(jù)該市電力財(cái)務(wù)報(bào)表數(shù)據(jù)如下表2-1所示。
表2-1 A市月度售電量統(tǒng)計(jì)表(2008年-2013年)(單位:

)
根據(jù)表2-1提供的售電量數(shù)據(jù),繪制出2008年1月至2012年12月共60個(gè)月的售電量折線圖(如圖2-1所示),該序列是一個(gè)劇烈波動(dòng)的序列,有很明顯的增長(zhǎng)趨勢(shì)和季節(jié)性,是一個(gè)非平穩(wěn)的隨機(jī)過程。
圖2-1 售電量時(shí)序圖
2.2、售電量預(yù)測(cè)及結(jié)果分析
A市2008年1月至2012年12月共60個(gè)月度售電量數(shù)據(jù)作為訓(xùn)練時(shí)間序列數(shù)據(jù),2013年1—12月的數(shù)據(jù)作為測(cè)試時(shí)間序列數(shù)據(jù)。首先直接使用Logistics回歸預(yù)測(cè)方法經(jīng)過訓(xùn)練后,預(yù)測(cè)2013年1—12月售電量;其次,運(yùn)用ARIMA預(yù)測(cè)方法通過訓(xùn)練后,預(yù)測(cè)2013年1—12月售電量;再運(yùn)用支持向量回歸預(yù)測(cè)方法經(jīng)過訓(xùn)練后,預(yù)測(cè)2013年1—12月的售電量;最后,運(yùn)用本文提出的多模型融合預(yù)測(cè)方法對(duì)2013年1—12月售電量進(jìn)行預(yù)測(cè),在本案例中,多模型融合選擇Logistics回歸預(yù)測(cè)方法、ARIMA預(yù)測(cè)方法和支持向量機(jī)預(yù)測(cè)方法作為基本預(yù)測(cè)方法。圖2-2為上述四種預(yù)測(cè)方法的預(yù)測(cè)結(jié)果與實(shí)際售電量對(duì)比圖。
圖2-2 四種預(yù)測(cè)方法的預(yù)測(cè)結(jié)果與實(shí)際售電量對(duì)比圖
為比較上述四種方法的預(yù)測(cè)效果,引入最大絕對(duì)誤差(MaxE)、平均絕對(duì)相對(duì)誤差(MARE)和最大絕對(duì)誤差(MaxARE),其計(jì)算公式如下:
上式中,N是預(yù)測(cè)數(shù)據(jù)的個(gè)數(shù),本案例中N為12;

是第i月的售電量實(shí)際值;

是第i月售電量預(yù)測(cè)值。
使用MaxE、MARE和MaxARE對(duì)Logistics回歸預(yù)測(cè)方法的預(yù)測(cè)結(jié)果、ARIMA預(yù)測(cè)方法的預(yù)測(cè)結(jié)果、支持向量機(jī)預(yù)測(cè)方法的預(yù)測(cè)結(jié)果和多模型融合預(yù)測(cè)方法的預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià),各預(yù)測(cè)方法預(yù)測(cè)誤差指標(biāo)對(duì)比如下表2-2所示。
表2-2 各預(yù)測(cè)方法預(yù)測(cè)誤差對(duì)比
通過月售電量預(yù)測(cè)值和實(shí)際值的對(duì)比分析,本文所提出的多模型融合預(yù)測(cè)方法預(yù)測(cè)效果優(yōu)于Logistics回歸預(yù)測(cè)方法、ARIMA預(yù)測(cè)方法和支持向量機(jī)預(yù)測(cè)方法。因此,運(yùn)用多模型融合預(yù)測(cè)方法進(jìn)行售電量預(yù)測(cè)能夠提高預(yù)測(cè)精度,保證預(yù)測(cè)誤差的穩(wěn)定性。
3、結(jié)束語
電力系統(tǒng)的售電量受氣候,氣溫和人類活動(dòng)等因素影響,其變化特征具有隨機(jī)性和不穩(wěn)定性。本文提出一種多模型融合預(yù)測(cè)方法,將Logistics回歸預(yù)測(cè)方法、ARIMA預(yù)測(cè)方法和支持向量機(jī)預(yù)測(cè)方法通過多模型融合算法,得到其組合權(quán)重系數(shù),此方法綜合了各種基本預(yù)測(cè)方法在不同條件下預(yù)測(cè)結(jié)果的精度,并將這些信息融合在一起得到最終售電量預(yù)測(cè)值。在某市月度售電量數(shù)據(jù)預(yù)測(cè)中運(yùn)用該方法作為案例驗(yàn)證,案例分析結(jié)果表明用多模型融合預(yù)測(cè)方法對(duì)售電量進(jìn)行預(yù)測(cè)是可行且可靠的,為電力分配及電網(wǎng)改造提供了重要的理論依據(jù)。然而,本文針對(duì)售電量預(yù)測(cè)所提出的多模型融合預(yù)測(cè)方法也具有進(jìn)一步優(yōu)化的空間,因?yàn)檫\(yùn)用多模型融合預(yù)測(cè)方法是定量的,完全是由數(shù)據(jù)驅(qū)動(dòng)的,如何在該方法的基礎(chǔ)上加一定的定性分析,彌補(bǔ)數(shù)據(jù)驅(qū)動(dòng)的不足,仍需要進(jìn)一步研究。