作者:國工智能研發部—陳渝敏
READING
業務背景
面對市場競爭的日益激烈,制造企業想要得到客戶的認可,不得不從價格優勢轉向高質量的產品優勢。產品質量的高低已經成為企業核心競爭力的重要一環。只要挖掘出生產過程中影響產品質量的關鍵因素及其內在聯系,就能有針對性地采取預防措施,從而提高產品質量,為企業持續改善質量提供決策支持。那么在時間序列處理領域,如何高效地發現影響產品質量或成本的多維因素?國工智能MAI平臺提供了基于挖掘產品質量或成本影響因素的格蘭杰因果關系檢驗算法。
READING
含義
格蘭杰因果關系指的是一種預測因果關系,存在因果關系說明兩變量之間相關或相互影響。其基本思想為:對于時間序列X和時間序列Y,如果同時依據X和Y的以前值對Y進行回歸所產生的Y的預測模型比僅對Y的以前值進行回歸所產生的模型要好,即第一種情況產生的誤差小于第二種情況產生的誤差δ2那么將時間序列X稱為時間序列Y的“格蘭杰原因”。此外,X和Y之間的依賴關系即為格蘭杰因果關系?煞譃槿N情形:
(1)單向因果。是Y的原因,但不是的原因。
(2)雙向因果。是的原因,同時是的原因,該情形也稱為雙向因果關系。
(3)不存在因果關系。不是的原因,且不是的原因。
READING
格蘭杰檢驗的適用范圍
Granger因果檢驗只能檢驗兩兩變量之間的因果關系,并且只能適用于具有平穩性的時間序列數據模型的檢驗,無法檢驗只有橫截面數據時變量間的關系。
原始的格蘭杰因果性定義并沒有規定變量必須是平穩的。在格蘭杰重新回顧他的因果性定義的時候,對變量平穩性也沒有再深入分析。但是目前有一點學術界是有定論的,就是如果變量是非平穩的,那么應用F統計量來做推斷會產生問題。計量經濟學資深專家周建、李子奈運用蒙特卡洛模擬也得出當變量為非平穩時間序列時任何無關的兩個的變量間都很容易得出有因果性的結論。因此,在實證研究時,一般認為只有平穩變量才能應用F統計量進行推斷,否則結論可能是不可靠的。
READING
應用場景
對于啤酒生產企業,控制能源消耗是生產管理的重要部分。制冷耗電量是啤酒生產最大的能源消耗之一,占啤酒企業耗電量的43%左右。怎樣降低能源消耗,加大成本控制力度是啤酒企業搞好生產管理的首要問題。為此本案例將驗證冷麥汁的產量和制冷耗電量是否存在因果關系。從而為減少能源消耗提供決策方向。
下表是某啤酒企業2005-2009年各個季度冷麥汁的產量和制冷耗電量的數據,該時間序列數據經過差分處理是平穩的,符合格蘭杰因果檢驗的前提。利用AIC信息準則確定最優階數是1,接下來將使用國工數據大腦已經集成好的格蘭杰因果關系檢驗算法對數據進行雙向因果關系檢驗,即檢驗冷麥汁的產量是否為制冷耗電量的格蘭杰原因及制冷耗電量是否為冷麥汁產量的格蘭杰原因。
首先,從數據大腦中的組件面板搜索格蘭杰因果關系檢驗組件,拖到到工作面板,配置數據及組件參數:滯后期數選擇1,顯著性水平選擇0.1,點擊運行。過程如圖1:
READING
分析結果
檢驗結果如圖2顯示,當滯后期數為1時,在耗電量是否為冷麥汁產量原因的格蘭杰檢驗中,查F分布表可知,顯著性水平為0.1所對應的,F檢驗統計量的值為0.0257,故F統計量的值<臨界值,接受原假設,認為耗電量不是冷麥汁產量的格蘭杰原因;在冷麥汁產量是否為耗電量原因的格蘭杰檢驗中,,F檢驗統計量的值為4.0191,故F統計量的值>臨界值,拒絕原假設,認為冷麥汁產量是耗電量的格蘭杰原因。所以,冷麥汁產量和耗電量之間存在單向因果關系,與實際相符。也就是說這個季度的耗電量出現變化是因為上個季度的冷麥汁產量出現變化。
責任編輯:殷守龍