文|常澗滕
編輯|常澗滕
介紹
如今,原油價格預(yù)測在全球能源和經(jīng)濟(jì)系統(tǒng)中的重要作用已成為數(shù)據(jù)分析和預(yù)測中的一個有吸引力的問題,原油價格與其他大宗商品一樣,受供需等市場因素影響較大,原油價格預(yù)測已變得越來越具有挑戰(zhàn)性。
本文著重于通過減少隨機(jī)不確定性來高精度地預(yù)測原油價格。
在過去的二十年中,典型的統(tǒng)計(jì)工具和計(jì)量經(jīng)濟(jì)學(xué)方法被用于預(yù)測原油價格,例如廣義自回歸條件異方差(GARCH)模型,自回歸移動平均(ARIMA)模型,線性回歸,樸素隨機(jī)游走、糾錯模型(ECM)和向量自回歸(VAR)模型。
與單一模型相比,基于分解和集成策略的模型可以很好地模擬原油價格復(fù)雜數(shù)據(jù),由于分解過程,由于時間序列被分解成多個獨(dú)立模式,模型復(fù)雜性、計(jì)算時間和成本會產(chǎn)生另一個問題。
為了進(jìn)一步提高預(yù)測效率和有效性,使用從EEMD獲得的分解模式的新方法,遵循眾所周知的“分解與集成”框架,提出了一種利用重構(gòu)模型預(yù)測原油價格的新方法。
研究框架
研究中使用的框架或步驟如下:
1.使用EEMD技術(shù)將原始時間序列分解為IMF
2.IMF根據(jù)其影響分為兩部分,即基于AMI的隨機(jī)和確定性
3.使用Box-Jenkins方法為每個隨機(jī)IMF和確定性組件選擇最佳ARIMA模型,并獲得用作KF模型輸入的參數(shù)估計(jì)值,每個隨機(jī)IMF和確定性成分的KF模型的輸出被簡單地相加以獲得預(yù)測值。
4.最后,比較預(yù)謀的方法以檢查哪個模型提供更準(zhǔn)確的預(yù)測。
集成EMD(EEMD)
Wu和Huang 介紹了著名分解技術(shù)的新版本,即EMD,它最初是由通過向調(diào)頻參數(shù)添加一些噪聲而開發(fā)的。
- 在每個提取信號的完整長度上,過零數(shù)和極值數(shù)之差不得超過1。
- 由下包絡(luò)和上包絡(luò)定義的任何點(diǎn)處的信號平均值將始終等于零。
圖1
保留這兩個限制,可以從原始信號中提取有意義的IMF,原始時間序列 Yt可以通過簡單地添加所有IMF來從分解的組件中輕松獲得,如下所示:
使用EMD技術(shù)的特性,EEMD過程可以描述如下:
- 將白噪聲系列添加到目標(biāo)數(shù)據(jù)中。
- 獲得來自添加的白噪聲數(shù)據(jù)的IMF。
- 對于不同的白噪聲系列,每次重復(fù)步驟(1)和(2)。
- 因此,獲得了分解序列的系綜對應(yīng)的IMF。
ARIMA模型
從過去五十年開始,Box-Jenkins過程是分析時間序列應(yīng)用程序的常用方法,最初由Box和Jenkins 提出; ARIMA模型的表達(dá)式如等式(2)所示。
αi , βi表示ARIMA模型的參數(shù),εt 是均值和方差為零的白噪聲過程,σ2 .εt - i 表示先前的誤差項(xiàng),而p和q是各自項(xiàng)的順序。
未重構(gòu)的EEMD-ARIMA模型
EEMD-ARIMA模型使用從EEMD獲得的所有IMF,該模型也稱為不帶重建分解集成(RDE)模型,在這種技術(shù)中,所有IMF都被建模并用于預(yù)測目的,EEMD-ARIMA過程可以總結(jié)為以下三個步驟。
- 分解了原來的時間序列Yt(t=1,2,?T) 進(jìn)入n 組件(IMF)我米Fj( t ) ( j = 1 , 2 , ? , n ) 。
- 為所有提取的IMF選擇最佳ARIMA模型,并對相應(yīng)的序列建模,并對每個序列進(jìn)行預(yù)測。
- 最后將所有IMF的預(yù)測結(jié)果相加,得到目標(biāo)時間序列的輸出。
無RDE模型(即EEMD-ARIMA和EEMD-ARIMA-KF)的流程圖如圖2所示。
圖2 無RDE模型的流程圖
預(yù)測評價標(biāo)準(zhǔn)
本研究中提出的模型EEMD(SD)-ARIMA-KF的預(yù)測能力應(yīng)使用六個不同的標(biāo)準(zhǔn)來衡量,并定義如下:
均方根誤差(RMSE)
平均絕對誤差(MAE)
平均絕對百分比誤差(MAPE)
n 代表預(yù)測總數(shù),Y^t 用于預(yù)測值和Yt 用于給定時間的原始值,上面提到的三種方法在預(yù)測精度上比較常見,但是這些方法只衡量預(yù)測的水平,而不衡量預(yù)測的方向。
數(shù)據(jù)信息
在本文中,使用了兩個眾所周知的基準(zhǔn)價格的原油日價格數(shù)據(jù),即布倫特和WTI數(shù)據(jù)集,這些數(shù)據(jù)集是從湯森路透運(yùn)營的DataStream中收集的。
布倫特原油價格的第一個數(shù)據(jù)集涵蓋了將近39個日歷年(1970年2月2日至2008年5月29日),總共9999個觀測值用作訓(xùn)練。
另外八年的原油價格數(shù)據(jù)(2008年5月30日-2016年11月3日)共保留2200個觀測值用于測試,第二個數(shù)據(jù)集是WTI原油價格,涵蓋了27個日歷年(1983年1月11日至2010年8月15日)共7200個觀測值用作訓(xùn)練。
EEMD模型
EEMD取決于直接影響此過程性能的兩個參數(shù),應(yīng)在使用EEMD之前固定,這兩個參數(shù)是合奏的數(shù)量和白噪聲的幅度。
EEMD技術(shù)在這項(xiàng)工作中采用了上述描述,并相應(yīng)地在不同的IMF中分解了兩個原油系列,
R包“Rlibeemd”用于這項(xiàng)工作中的數(shù)據(jù)分解,兩種原油價格的分解結(jié)果如圖4和圖5所示。
圖4 布倫特原油價格分解結(jié)果
圖5 WTI原油價格分解結(jié)果
在本節(jié)中,將計(jì)算單個模型作為基準(zhǔn),計(jì)算了布倫特和WTI原油價格的最佳ARIMA模型,布倫特系列的最佳選擇模型是ARIMA(5,2,0),而對于WTIARIMA(3,1,2),R包預(yù)測用于ARIMA模型選擇和計(jì)算。
表1的值證明ARIMA和GARCH模型的所有參數(shù)對于布倫特和WTI原油價格系列在1%的顯著性水平上具有統(tǒng)計(jì)顯著性。
為便于比較,布倫特和WTI原油價格序列的預(yù)測準(zhǔn)確度均列于表5。
表1 ARIMA和GARCH模型估計(jì)
表2 隨機(jī)和確定性成分的預(yù)測準(zhǔn)確性
表3 布倫特和WTI的所有IMF的ARIMA模型階數(shù)
表4 每個隨機(jī)IMF、確定性和隨機(jī)分量的KF遞歸的初始值
表5 不同模型的預(yù)測精度
平均互信息
EEMD以第一個IMF與下一個IMF相比具有最大頻率的模式生成IMF,反之亦然;因此,EEMD通過去除從高頻到低頻的分量,起到頻率濾波器的作用。
所有IMF的AMI圖分別顯示在圖6和圖7中,從圖6和圖7的目視檢查中可以看出,AMI的圖在第5個IMF到最后一個IMF之后遵循相同的模式。
圖6 布倫特原油價格的所有IMF的AMI圖
圖7 WTI原油價格的所有IMF的AMI圖
對于隨機(jī)分量,組合所有隨機(jī)IMF,而對于確定性分量,將所有確定性IMF相加,布倫特和WTI數(shù)據(jù)集的這兩個分量如圖8和圖9所示。
圖8 布倫特原油的隨機(jī)和確定性成分
圖9
ARIMA-KF模型
一旦對所研究的時間序列執(zhí)行了ARIMA建模,就可以創(chuàng)建ARIMA-KF模型,當(dāng)實(shí)現(xiàn)數(shù)據(jù)的平穩(wěn)性時,將Box-Jenkins方法應(yīng)用于時間序列。
布倫特和WTI原油價格的SE和OE被初始化,KF遞歸用于原油價格預(yù)測,KF遞歸的SE結(jié)合了ARIMA模型的線性和非線性成分;由于線性和非線性成分的結(jié)合有助于提高原油價格預(yù)測的準(zhǔn)確性,并能夠處理原油價格數(shù)據(jù)中的隨機(jī)不確定性,OE表示擬合序列,也用于測量預(yù)測誤差。
EEMD(S+D)-ARIMA-KF模型
預(yù)測原油價格的方法是基于卡爾曼濾波器的隨機(jī)和確定性分量的EEMD,時間序列通過EEMD分解為IMF,接下來使用AMI方法將IMF劃分為隨機(jī)和確定性成分,表3顯示了從兩種原油價格的EEMD獲得的所有IMF的ARIMA模型的順序,對于EEMD-ARIMA模型,使用了ARIMA模型的這些階數(shù),模型EEMD-ARIMA也稱為沒有RDE模型。
表3 布倫特和WTI的所有IMF的ARIMA模型階數(shù)
EEMD(SD)-ARIMA-KF模型
為了減少重構(gòu)IMF的隨機(jī)分量中的隨機(jī)性,我們分別對每個IMF進(jìn)行建模,作為隨機(jī)分量的一部分;預(yù)計(jì)與將所有隨機(jī)IMF作為單個組件處理相比,對隨機(jī)IMF單獨(dú)建模將提供更準(zhǔn)確的預(yù)測。
表5 不同模型的預(yù)測精度
結(jié)果討論
為了評估所提出模型EEMD(SD)-ARIMA-KF的性能,采用了六種定量性能評估措施,包括RMSE、MAE、MAPE、DS、NADF和DM測試,表5顯示了采用這些措施的所有模型的布倫特和WTI原油價格的結(jié)果。
表5顯示了布倫特和WTI原油價格的所有模型的RMSE,圖10中繪制了更清晰的圖片,在所有模型中,EEMD(SD)-ARIMA-KF在兩個市場中都取得了最低值(最好)。
圖10 不同模型對WTI和布倫特原油價格的RMSE、MAE和MAPE圖
MAE是為布倫特和WTI原油價格的所有模型計(jì)算的預(yù)測評估標(biāo)準(zhǔn)的另一種度量,如表5所示并繪制在圖10中;從MAE得出的結(jié)論與RMSE沒有什么不同;EEMD(SD)-ARIMA-KF模型在兩個市場上都取得了最低值,并且優(yōu)于所有其他基準(zhǔn)模型。
作方向性預(yù)測更為重要,因?yàn)橥顿Y者和政策制定者總是在尋找市場價格上漲或下跌的趨勢;關(guān)于定向預(yù)測,單一模型ARIMA和GARCH的DS值顯示在表5中并繪制在圖11中兩種原油價格都在51.14–53.13的范圍內(nèi),非常接近隨機(jī)猜測。
圖11 不同模型對WTI和布倫特原油價格的DS圖
下一個衡量標(biāo)準(zhǔn)是準(zhǔn)確方向預(yù)測(NADF)的數(shù)量,模型EEMD(SD)-ARIMA-KF的NADF分別為布倫特和WTI原油價格的1817/2200和1385/1623,如表5和圖12所示; 這是所有其他模型中最高的NADF,ARIMA、GARCH、NA?VE、EEMD-ARIMA和EEMD-ARIMA-KF模型的NADF預(yù)測范圍分別為布倫特和WTI原油價格的1124–1289/2200和843–959/1623,非常接近隨機(jī)猜測。
所以,這五個模型并沒有提供很好的方向性預(yù)測;EEMD(S+D)-ARIMA和EEMD(S+D)-ARIMA-KF模型的NADF在Brent和WTI原油價格的1353–1445/2200和1012–1044/1623范圍內(nèi)
圖12 WTI和布倫特原油價格的不同模型的NADF圖
為了驗(yàn)證EEMD(SD)-ARIMA-KF模型的優(yōu)越性,本研究還使用了DM檢驗(yàn),布倫特原油價格的DM檢驗(yàn)統(tǒng)計(jì)值及其對應(yīng)的p值(括號內(nèi))見表6,WTI原油價格見表7。
表6 布倫特原油價格的Diebold–Mariano(DM)測試結(jié)果
表7 WTI原油價格的Diebold–Mariano(DM)測試結(jié)果
將測試集的擬議模型EEMD(SD)-ARIMA-KF預(yù)測值與布倫特和WTI原油價格的原始值作圖,ARIMA、ARIMA-KF和EEMD(SD)-ARIMA模型預(yù)測值也繪制在布倫特和WTI每日原油價格的圖13中。
圖13 布倫特和WTI原油價格不同模型的原始值和預(yù)測值
從以上結(jié)果和分析,我們可以得出以下結(jié)論:
盡管基于卡爾曼濾波的混合模型優(yōu)于統(tǒng)計(jì)模型,但由于非線性和非平穩(wěn)性,單一統(tǒng)計(jì)模型ARIMA、GARCH和NA?VE無法在原油價格上取得令人滿意的結(jié)果。
由于將模式重構(gòu)為相對簡單的組件的策略,與單個和沒有RDE模型相比,具有重構(gòu)模式的基于KF的集合模型顯著提高了預(yù)測精度,即隨機(jī)性和確定性。
所提出的EEMD(SD)-ARIMA-KF在RMSE、MAE、MAPE、DS、DM測試和NADF方面優(yōu)于比較模型。
實(shí)驗(yàn)結(jié)果表明,將模式重構(gòu)為隨機(jī)和確定性分量是一種非常有效的方法,用于在集合模型中預(yù)測原油價格。
結(jié)論和未來的工作
提出了一種混合EEMD(SD)-ARIMA-KF方法來提高原油價格的預(yù)測精度;為了證明所提出模型的性能,我們將其與流行市場WTI和布倫特原油價格的最先進(jìn)方法進(jìn)行了比較。
實(shí)驗(yàn)結(jié)果表明,所有方法;ARIMA、GARCH、NA?VE、ARIMA-KF、EEMD-ARIMA、EEMD-ARIMA-KF、EEMD(S+D)-ARIMA、EEMD(S+D)-ARIMA-KF、EEMD(SD)-ARIMA和EEMD(SD))-ARIMA-KF是有效的。
然而,所有預(yù)測精度指標(biāo)RMSE、MAE、MAPE、DS、NADF和DM測試表明,混合模型EEMD(SD)-ARIMA-KF方法是高精度預(yù)測世界原油價格的最有效程序。
新的混合模型方法的優(yōu)點(diǎn)是單獨(dú)處理隨機(jī)固有模式函數(shù)的結(jié)果,其中ARIMA模型的線性和非線性部分由卡爾曼濾波器組合以處理隨機(jī)不確定性。
參考文獻(xiàn)
L.Yu、Y.Zhao和L.Tang,“基于壓縮傳感的原油價格預(yù)測人工智能學(xué)習(xí)范式”,能源經(jīng)濟(jì)學(xué),卷46,第236-245頁,2014年11月。
X.Zhang、L.Yu、S.Wang和KKLai,“估計(jì)極端事件對原油價格的影響:一種基于EMD的事件分析方法”,EnergyEcon,卷31,第768-778頁,2009年。
K.He、L.Yu和KKLai,“使用小波分解集成模型進(jìn)行原油價格分析和預(yù)測”,能源,卷46,第564-574頁,2012年。
如果你也喜歡我的文章,不妨點(diǎn)個“關(guān)注”吧!小生在此謝過了!
END