時間序列的預測方法可以歸納為三類:
1、時間序列基本規則法-周期因子法;
2、傳統序列預測方法,如均值回歸、ARIMA等線性模型;
3、機器學習方法,將序列預測轉為有監督建模預測,如XGBOOST集成學習方法,LSTM長短期記憶神經網絡模型。
當序列存在周期性時,通過加工出數據的周期性特征預測。這種比較麻煩,簡述下流程不做展開。
1、計算周期的 因子 。
2、計算base
3、預測結果=周期因子*base
ARIMA模型,差分整合移動平均自回歸模型,又稱整合移動平均自回歸模型
(移動也可稱作滑動),時間序列預測分析方法之壹。ARIMA(p,d,q)中,
AR是"自回歸",p為自回歸項數;MA為"滑動平均",q為滑動平均項數,
d為使之成為平穩序列所做的差分次數(階數)。
建模的主要步驟是:
1、數據需要先做平穩法處理:采用(對數變換或差分)平穩化後,並檢驗符合平穩非白噪聲序列;
2、觀察PACF和ACF截尾/信息準則定階確定(p, q);
3、 建立ARIMA(p,d,q)模型做預測;
Long Short Term 網絡是壹種 RNN 特殊的類型,可以學習長期依賴序列信息。
LSTM區別於RNN的地方,主要就在於它在算法中加入了壹個判斷信息有用與否的“處理器”,這個處理器作用的結構被稱為cell。壹個cell當中被放置了三扇門,分別叫做輸入門、遺忘門和輸出門。壹個信息進入LSTM的網絡當中,只有符合信息才會留下,不符的信息則通過遺忘門被遺忘。通過這機制減少梯度爆炸/消失的風險。
建模主要的步驟:
1、數據處理:差分法數據平穩化;MAX-MIN法數據標準化;構建監督學習訓練集;(對於LSTM,差分及標準化不是必要的)
2、模型訓練並預測;