時間序列中時變波動率下誤差自共變異數的貝氏非參數估計

1. 緒論

異質變異性是許多經濟與金融時間序列的基本特徵，此點已由Engle (1982) 提出的ARCH模型所確立。傳統建模誤差自共變異數的方法通常施加了限制性的參數結構，存在模型設定錯誤的風險。本文提出一種貝氏非參數方法來估計誤差自共變異數函數的頻譜密度，有效地將問題轉移到頻域，以避免時域核方法中頻寬選擇的複雜性。此框架擴展至處理恆定與時變的誤差波動率，其應用在匯率預測上展現出優於隨機漫步模型等基準方法的性能。

2. 方法論

核心方法論涉及一個分層貝氏框架，用於聯合估計模型參數、時變波動率以及誤差過程的頻譜密度。

2.1 模型架構

基礎模型為迴歸框架：$y = X\beta + \epsilon$，其中 $\epsilon_t = \sigma_{\epsilon, t} e_t$。此處，$e_t$ 是一個標準化、弱平穩的高斯過程，其自相關函數為 $\gamma(\cdot)$，頻譜密度為 $\lambda(\cdot)$。時變波動率 $\sigma^2_{\epsilon, t}$ 以靈活的方式建模，通常使用以B樣條函數表示的對數轉換。

2.2 貝氏非參數頻譜估計

遵循 Dey 等人 (2018) 的方法，對對數頻譜密度 $\log \lambda(\omega)$ 設定一個高斯過程先驗。此先驗具有靈活性，避免了限制性的參數假設。為了計算效率，在頻域中使用 Whittle 概似近似。對於 $\lambda(\omega)$ 以及隨之而來的 $\gamma(\cdot)$ 的後驗推論，是透過馬可夫鏈蒙地卡羅方法進行。

2.3 時變波動率建模

對於時變情況，$\log(\sigma^2_{\epsilon, t})$ 被建模為時間的平滑函數，通常使用B樣條基函數的線性組合：$\log(\sigma^2_{\epsilon, t}) = \sum_{j=1}^J \theta_j B_j(t)$。對係數 $\theta_j$ 設定先驗，以鼓勵平滑性。

3. 實驗結果與分析

3.1 模擬研究

該方法在具有已知自相關結構（例如ARMA類型）和隨機波動率模式的模擬數據上進行了驗證。關鍵指標包括恢復真實頻譜密度的準確性以及可信區間的覆蓋率。貝氏非參數方法在不同的數據生成過程中展現了穩健的性能，無需先驗知識滯後結構，便能有效捕捉短期和長期的依賴性。

3.2 匯率預測應用

主要的實證應用涉及預測主要貨幣匯率（例如，美元/歐元、美元/日圓）。

預測性能摘要

基準模型： 無漂移項的隨機漫步、GARCH(1,1)、參數化ARIMA。

指標： 在多個樣本外期間的均方根預測誤差和平均絕對預測誤差。

結果： 所提出的貝氏非參數模型持續優於隨機漫步基準，並與標準的GARCH和參數化時間序列模型競爭，且經常勝出。在市場波動性高的時期，改進尤為顯著，其中靈活的波動率建模被證明具有優勢。

圖表說明： 折線圖通常會顯示所提模型與隨機漫步和GARCH的樣本外預測路徑。所提模型的預測會更緊密地貼近實際實現的匯率路徑，特別是在轉折點和波動階段。長條圖會比較各模型的均方根預測誤差/平均絕對預測誤差，所提方法的長條最短。

4. 核心洞察與分析師觀點

核心洞察： 本文為時間序列建模提供了一個關鍵但常被忽視的升級：將誤差依賴性視為需要學習而非假設的一等公民。通過其頻譜密度非參數地估計完整的自共變異數結構，它直接攻擊了許多模型的阿基里斯腱——錯誤設定的誤差動態。加入時變波動率不僅僅是一個額外功能；對於金融數據來說，它是現實主義的必要層次，使該模型成為波動率聚集環境（如貨幣市場）中的強大工具。

邏輯流程： 論證過程優雅。步驟1：承認參數化誤差模型是一種負債。步驟2：轉移到頻域以優雅地處理非參數估計（避開頻寬選擇的詛咒）。步驟3：在對數頻譜上使用高斯過程先驗——一個數學上合理且靈活的選擇。步驟4：將此與時變波動率模型整合，認識到在真實數據中，尺度與依賴性是相互交織的。步驟5：透過擊敗金融領域最艱難的基準——匯率的隨機漫步模型——來驗證。從問題識別到技術解決方案再到實證證明的流程，連貫且具說服力。

優點與缺點： 其優點在於全面的靈活性。它不強迫數據進入ARMA或GARCH的框架。使用Whittle概似和MCMC是標準但有效的做法。缺點在於，如同許多貝氏非參數方法，存在計算成本問題。對於非常長的序列，針對高斯過程和樣條函數的MCMC並非易事。本文也嚴重依賴匯率範例；更多樣化的應用（例如，宏觀經濟、能源）將加強其可推廣性的論據。此外，雖然引用了 Dey 等人 (2018) 的研究，但對於其新穎貢獻——與時變波動率的整合——可以更清晰地加以區分。

可行洞察： 對於量化分析師和計量經濟學家：這是一個現成的框架，適用於標準模型失效的高風險預測場景。程式碼在GitHub上是一個主要優點。立即行動是在誤差結構可疑的專有數據集上進行測試。對於研究人員：該方法論是一個模板。頻譜上的高斯過程想法可以移植到其他潛在變量模型中。下一步邏輯步驟是處理高維設定或納入其他非參數先驗，例如基於神經網路的先驗，如同現代深度學習用於時間序列（例如，受時間融合轉換器啟發的架構）。該領域正朝著將貝氏非參數方法與深度學習相結合的混合模型發展，正如艾倫圖靈研究所等機構的評論所指出的，而這項工作正處於一個富有成果的交匯點。

5. 技術細節

關鍵數學公式：

模型： $y_t = x_t'\beta + \epsilon_t, \quad \epsilon_t = \sigma_{\epsilon, t} e_t$。
誤差過程： $e_t \sim \text{GP}(0, \gamma)$，其中 $\text{Cov}(e_t, e_{t-k}) = \gamma(k)$。
頻譜密度： $\lambda(\omega) = \frac{1}{2\pi} \sum_{k=-\infty}^{\infty} \gamma(k) e^{-i k \omega}, \quad \omega \in [-\pi, \pi]$。
頻譜先驗： $\log \lambda(\omega) \sim \text{GP}(\mu(\omega), C(\omega, \omega'))$，其中 $C$ 是合適的共變異數核。
波動率模型： $\log(\sigma^2_{\epsilon, t}) = \sum_{j=1}^J \theta_j B_j(t), \quad \theta \sim N(0, \tau^2 I)$。
概似函數 (Whittle 近似)： $p(I(\omega_j) | \lambda(\omega_j)) \approx \frac{1}{\lambda(\omega_j)} \exp\left(-\frac{I(\omega_j)}{\lambda(\omega_j)}\right)$，其中 $I(\omega_j)$ 是傅立葉頻率 $\omega_j$ 處的週期圖。

6. 分析框架範例

情境： 分析加密貨幣（例如比特幣）的日報酬率，以預測波動率和依賴結構。

框架步驟 (概念性)：

預處理： 取得對數報酬率。可選擇性地移除任何極低頻趨勢。
模型設定：
- 均值方程式：可能是一個簡單的常數或AR(1)項：$r_t = \mu + \phi r_{t-1} + \epsilon_t$。
- 誤差分解：$\epsilon_t = \sigma_t e_t$。
- 為 $\log(\sigma^2_t)$ 指定B樣條基（例如，在樣本期間內設置20個節點）。
- 為 $\log \lambda(\omega)$ 指定高斯過程先驗（例如，使用Matern共變異數核）。
先驗設定： 設定高斯過程平滑度、樣條係數變異數 ($\tau^2$) 和迴歸參數 ($\beta$) 的超參數。使用弱資訊先驗。
後驗計算： 實作一個MCMC取樣器（例如，在Stan中使用哈密頓蒙地卡羅或自訂的吉布斯取樣器），從 $ (\beta, \theta, \lambda(\cdot)) $ 的聯合後驗中抽取樣本。
推論與預測：
- 檢查 $\sigma_t$ 的後驗均值/中位數，以觀察波動率演變。
- 繪製 $\lambda(\omega)$ 的後驗均值，以理解依賴性的頻率結構。
- 將 $\lambda(\omega)$ 轉換回時域，以獲得自相關函數 $\gamma(k)$ 的估計。
- 使用後驗樣本為未來報酬率生成預測分佈。

註：作者在GitHub上的程式碼儲存庫為實作提供了實用的起點。

7. 未來應用與方向

高頻金融： 調整模型以處理具有微結構噪音和超高維頻譜估計的盤中數據。
多變量擴展： 為向量誤差過程的交叉頻譜密度矩陣開發貝氏非參數模型，這對於投資組合分析和溢出效應研究至關重要。
與深度學習整合： 用深度生成模型（例如，在頻譜域上的變分自編碼器）取代高斯過程先驗，以捕捉極其複雜、非平穩的依賴模式，遵循如「CycleGAN」等論文用於風格轉換的創新精神，但應用於時間序列頻譜。
即時預測系統： 為即時風險管理和演算法交易平台創建可擴展的近似推論版本（例如，使用隨機變分推論）。
宏觀金融： 將該框架應用於建模中央銀行和政策機構使用的大型貝氏VAR中的誤差結構，其中錯誤設定的衝擊動態可能導致有缺陷的政策結論。

8. 參考文獻

Engle, R. F. (1982). Autoregressive conditional heteroscedasticity with estimates of the variance of United Kingdom inflation. Econometrica, 50(4), 987-1007.
Kim, K., & Kim, K. (2016). Time-varying volatility and macroeconomic uncertainty. Economics Letters, 149, 24-28.
Dey, D., Kim, K., & Roy, A. (2018). Bayesian nonparametric spectral density estimation for irregularly spaced time series. Journal of the American Statistical Association, 113(524), 1551-1564.
Kim, K. (2011). Hierarchical Bayesian analysis of structural instability in macroeconomic time series. Studies in Nonlinear Dynamics & Econometrics, 15(4).
Whittle, P. (1953). Estimation and information in stationary time series. Arkiv för Matematik, 2(5), 423-434.
Zhu, J. Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired image-to-image translation using cycle-consistent adversarial networks. Proceedings of the IEEE international conference on computer vision (以CycleGAN論文作為先進、靈活生成建模的範例)。
Alan Turing Institute. (2023). Research Themes: Data-Centric Engineering and AI for Science. (關於混合AI/統計學方法的背景)。