1. 서론
환율 예측은 금융 시스템의 복잡성, 비선형성, 빈번한 구조적 변화로 인해 악명 높게 어려운 과제입니다. 전통적인 계량경제 모델은 이러한 역동성을 포착하고 예측에 대한 명확한 설명을 제공하는 데 종종 어려움을 겪습니다. 본 연구는 해석 가능한 기계 학습(Interpretable Machine Learning, IML) 프레임워크 내에서 캐나다-미국 달러(CAD/USD) 환율에 대한 기초 변수 기반 모델을 개발함으로써 이러한 격차를 해소하고자 합니다. 주요 목표는 정확한 예측을 달성하는 것뿐만 아니라 거시경제 기초 변수를 사용하여 예측을 설명함으로써 정책 입안자와 경제학자들의 신뢰와 실행 가능한 통찰력을 높이는 것입니다.
이 연구는 캐나다가 주요 상품 수출국, 특히 원유 수출국이라는 점에서 동기를 얻었습니다. 원유는 2019년 총 수출의 14.1%를 차지했으며, 2021년 미국 원유 수입의 61%를 차지했습니다. 이러한 상품이 환율에 미치는 시변적 영향을 이해하는 것은 매우 중요합니다.
해결된 주요 과제:
- 비선형성: 거시경제 변수 간의 관계는 종종 비선형적입니다.
- 다중공선성: 많은 요인들이 동시에 환율에 영향을 미칩니다.
- 해석 가능성: 블랙박스 모델은 이론적 일관성과 신뢰가 부족합니다.
2. 방법론 및 프레임워크
본 연구는 예측 모델링과 사후 해석을 결합한 포괄적인 IML 파이프라인을 사용합니다.
2.1 데이터 및 변수
CAD/USD 환율에 영향을 미칠 것으로 가정된 일련의 거시경제 및 금융 변수를 수집했습니다. 여기에는 다음과 같은 항목이 포함될 가능성이 높습니다:
- 상품 가격: 원유(WTI), 금, 천연가스.
- 금융 지표: S&P/TSX 종합 지수, 이자율 차이(캐나다 대 미국).
- 거시경제 기초 변수: GDP 성장률, 인플레이션 차이, 무역 수지.
데이터는 ML 모델에 적합하도록 전처리(예: 정상성 변환, 결측값 처리)됩니다.
2.2 기계 학습 모델
본 연구는 높은 예측 정확도로 알려진 강력하면서도 복잡한 앙상블 모델을 활용할 가능성이 높습니다:
- 그래디언트 부스팅 머신(GBM/XGBoost/LightGBM): 비선형 패턴과 상호작용을 포착하는 데 효과적입니다.
- 랜덤 포레스트: 과적합에 강하며 고유한 변수 중요도 측정치를 제공합니다.
- 신경망: 깊고 복잡한 시간적 의존성을 포착하는 데 잠재적으로 사용됩니다.
모델은 미래 환율 변동이나 수준을 예측하도록 훈련됩니다.
2.3 해석 가능성 기법
"블랙박스"를 열기 위해, 본 연구는 최신 IML 방법을 적용합니다:
- SHAP (SHapley Additive exPlanations): 각 변수가 각 개별 예측에 기여하는 정도를 정량화하는 게임 이론적 접근법입니다. 전역적 및 지역적 해석 가능성을 모두 제공합니다.
- 부분 의존도 플롯(Partial Dependence Plots, PDPs): 변수가 예측 결과에 미치는 한계 효과를 시각화합니다.
- 변수 중요도 순위: 모델별 메트릭 또는 순열 중요도에서 도출됩니다.
이러한 기법들은 특정 예측이 *왜* 이루어졌는지에 대한 답을 찾는 데 도움을 줍니다.
3. 실증 결과 및 분석
3.1 모델 성능
기계 학습 모델은 전통적인 선형 벤치마크(예: 벡터 자기회귀 - VAR)에 비해 우수한 예측 정확도를 보였습니다. 성능은 평균 제곱근 오차(RMSE), 평균 절대 오차(MAE) 및 방향 정확도와 같은 지표를 사용하여 평가되었습니다. 결과는 ML이 복잡한 환율 역학을 모델링할 수 있는 능력을 검증합니다.
3.2 변수 중요도 및 SHAP 분석
해석 가능성 분석은 명확하고 경제학적으로 직관적인 통찰을 제공했습니다:
- 원유 가격: 가장 중요한 결정 요인으로 부상했습니다. SHAP 값은 그 영향이 시변적이며, 부호와 크기의 변화가 상품 시장의 주요 사건(예: 2014년 유가 폭락, OPEC+ 결정)과 일치함을 보여주었습니다. 이는 캐나다의 변화하는 원유 수출 환경과 일치합니다.
- 금 가격: 두 번째로 중요한 변수로, 안전자산 및 인플레이션 헤지 역할을 하며 캐나다 달러에 영향을 미칩니다.
- TSX 주가지수: 세 번째로 중요한 변수로, 국내 경제 건전성과 자본 흐름을 반영합니다.
차트 설명 (암시적): SHAP 요약 플롯은 각 변수를 행으로 표시할 것입니다. 원유의 경우, 점들은 x축(예측에 대한 영향)에서 양의 SHAP 값과 음의 SHAP 값 양쪽에 퍼져 있을 것이며, 색상은 변수의 값(예: 낮은 유가는 파란색, 높은 유가는 빨간색)을 나타냅니다. 이는 시변적이고 단조롭지 않은 관계를 시각적으로 확인시켜 줍니다.
3.3 모델 정제를 위한 어블레이션 연구
주요 혁신은 해석 결과(예: SHAP에 의해 식별된 낮은 중요도 변수)를 사용하여 어블레이션 연구를 안내하는 것입니다. 중요도가 낮다고 판단된 변수들은 반복적으로 제거되고, 모델 성능이 재평가됩니다. 이 과정은 다음과 같은 역할을 합니다:
- 모델을 단순화하여 과적합과 계산 비용을 줄입니다.
- 노이즈를 제거함으로써 예측 정확도를 잠재적으로 향상시킵니다.
- 더 간결하고 집중된 최종 모델을 만들어 실용성을 높입니다.
4. 핵심 통찰 및 애널리스트 관점
핵심 통찰:
이 논문은 강력한 일타 이타를 제공합니다: 단순히 ML이 FX를 더 잘 예측할 수 있다는 것을 증명하는 데 그치지 않고, 해석 가능성을 무기로 삼아 데이터 기반 세분성으로 경제 이론을 검증합니다. 원유가 CAD/USD에 미치는 영향이 비선형적이고 체제 의존적이라는 발견은 단순히 학문적인 것이 아니라, 선형적이고 정적인 정책 모델에 대한 직접적인 도전입니다. 이 작업은 고금융 퀀트 모델과 중앙은행 계량경제 모델 사이의 종종 벌어지는 격차를 메웁니다.
논리적 흐름:
방법론은 우아하게 재귀적입니다: 1) 강력한 ML(XGBoost/RF)을 사용하여 복잡한 패턴을 포착하고, 2) SHAP를 사용하여 모델의 논리를 "디버깅"하며, 3) 그 통찰을 어블레이션을 통해 피드백하여 모델을 다듬고 개선합니다. 이는 자기 정제 분석 엔진을 만듭니다. 이는 SHAP를 소개한 Lundberg & Lee의 "A Unified Approach to Interpreting Model Predictions"(2017)와 같은 선구적인 IML 작업의 철학을 반영하며, 설명을 사후 고려가 아닌 모델 개발 생명주기의 핵심 부분으로 만듭니다.
강점과 결점:
강점: 해석 가능성에 의해 안내된 어블레이션 연구는 실용적인 모델 배포를 위한 걸작입니다. CAD/USD와 상품에 초점을 맞춘 것은 깔끔하고 설득력 있는 서사를 제공합니다. SHAP의 사용은 정책 입안자(큰 그림)와 트레이더(특정 시나리오) 모두를 만족시키는 전역적 및 지역적 설명을 제공합니다.
결점: 논문은 도출된 "설명"의 시간적 불안정성을 과소평가할 가능성이 있습니다. SHAP 값은 새로운 데이터와 함께 극적으로 변할 수 있으며, 이는 Slack et al.의 "Fooling LIME and SHAP"(2020)와 같은 연구에서 논의된 알려진 과제입니다. 이 모델은 해석 가능하지만 여전히 진정한 인과 모델보다는 "유리 상자"일 수 있습니다. 이는 관찰 경제 데이터에 적용된 대부분의 IML 접근법에 내재된 한계인 상관관계를 보여줄 뿐 인과관계를 보여주지는 않습니다.
실행 가능한 통찰:
중앙은행의 경우: 이 프레임워크는 더 투명하고 책임 있는 정책 모델을 구축하기 위한 청사진입니다. 캐나다 은행은 이를 운영화하여 명확한 귀속 분석과 함께 다양한 상품 가격 시나리오를 스트레스 테스트할 수 있습니다. 자산 운용사의 경우: 확인된 비선형적 원유-CAD 관계는 거래 가능한 통찰입니다. 이는 정적이 아닌 동적 헤지 비율을 주장합니다. 연구자의 경우: 이 템플릿은 확장 가능합니다. 이를 AUD/상품, NOK/원유 또는 신흥 시장 통화에 적용하십시오. 다음 개척지는 이를 인과 발견 방법(예: Pearl의 인과성 작업의 프레임워크 활용)과 통합하여 설명을 넘어 진정한 인과 추론으로 나아가 정책 시뮬레이션을 위한 모델을 더욱 강력하게 만드는 것입니다.
5. 기술적 구현 세부사항
5.1 수학적 공식화
핵심 예측 모델은 다음과 같이 나타낼 수 있습니다:
$\hat{y}_t = f(\mathbf{x}_t) + \epsilon_t$
여기서 $\hat{y}_t$는 시간 $t$에서 예측된 환율 수익률 또는 수준이고, $f(\cdot)$는 ML 모델(예: 그래디언트 부스팅 앙상블)이 학습한 복잡한 함수이며, $\mathbf{x}_t$는 입력 변수(원유 가격, 금, TSX 등)의 벡터이고, $\epsilon_t$는 오차항입니다.
단일 예측에 대한 변수 $i$의 SHAP 값 $\phi_i$는 평균 예측으로부터의 편차를 설명합니다:
$f(\mathbf{x}) = \phi_0 + \sum_{i=1}^{M} \phi_i$
여기서 $\phi_0$는 기준 값(평균 모델 출력)이고 $M$은 변수의 수입니다. $\phi_i$는 협력 게임 이론의 고전적인 샤플리 값 공식을 사용하여 모든 가능한 변수 조합을 고려하여 계산됩니다:
$\phi_i = \sum_{S \subseteq \{1,\ldots,M\} \setminus \{i\}} \frac{|S|! \, (M - |S| - 1)!}{M!} [f_{S \cup \{i\}}(\mathbf{x}_{S \cup \{i\}}) - f_S(\mathbf{x}_S)]$
이는 각 변수에 대한 예측의 공정한 귀속을 보장합니다.
5.2 분석 프레임워크 예시
시나리오: 특정 날짜에 캐나다 달러가 강세를 보일 것이라는 모델의 예측을 이해하기.
단계별 IML 분석:
- 지역적 SHAP 설명: 특정 예측에 대한 포스 플롯 또는 워터폴 플롯 생성.
- 출력: "예측: 캐나다 달러 1.5% 절상. 주요 동인: WTI 원유 (+1.1%), 금 가격 (+0.3%), TSX (약간의 하락으로 인해 -0.2%)."
- 상황적 확인: 시장 사건과 교차 참조.
- 조치: "이 날짜에 OPEC+가 감산을 발표하여 유가가 급등했습니다. 모델의 원유에 대한 높은 양의 SHAP 값은 이 기초적 충격과 완벽하게 일치합니다."
- PDP 분석: 원유 가격에 대한 PDP 검토.
- 관찰: "PDP는 현재 가격 수준에서 가파른 양의 기울기를 보여주며, 모델이 원유 가격 상승이 캐나다 달러를 강력하게 부양하는 체제에 있음을 확인시켜 줍니다."
- 어블레이션 피드백: 많은 예측에서 "미국 산업 생산"과 같은 변수의 SHAP 값이 거의 0에 가깝다면, 다음 모델 훈련 반복에서 제거 후보가 되어 단순성과 견고성을 향상시킵니다.
6. 향후 적용 및 연구 방향
- 실시간 정책 대시보드: 중앙은행은 이 IML 프레임워크를 실시간 대시보드로 배포하여 환율에 대한 실시간 동인 기여도를 보여주고, 커뮤니케이션과 개입 결정을 지원할 수 있습니다.
- 다국가 및 통화 바스켓 분석: 프레임워크를 확장하여 교차 통화 관계 또는 교역 가중 환율 지수를 모델링하고, 공통의 글로벌 동인과 국가별 동인을 식별합니다.
- 인과 추론과의 통합: IML을 최근의 인과 ML 발전(예: 이중 기계 학습, 인과 포레스트)과 결합하여 "무엇이 연관되어 있는가?"에서 "X를 변경하면 무슨 일이 일어날까?"로 나아가 반사실적 정책 분석을 가능하게 합니다.
- 대체 데이터: 뉴스/소셜 미디어의 감성 분석, 선박 교통 데이터 또는 원유 저장 시설의 위성 이미지를 통합하여 리드 타임과 예측력을 향상시킵니다.
- 규제를 위한 설명 가능한 AI(XAI): 금융 분야 AI에 대한 규제 감독(예: EU의 AI법)이 증가함에 따라, 이러한 해석 가능한 프레임워크는 규정을 준수하고 감사 가능한 모델 배포를 위한 경로를 제공합니다.
7. 참고문헌
- Lundberg, S. M., & Lee, S. I. (2017). A Unified Approach to Interpreting Model Predictions. Advances in Neural Information Processing Systems (NeurIPS), 30.
- Chen, S. S., & Chen, H. C. (2007). Oil prices and real exchange rates. Energy Economics, 29(3), 390-404.
- Beckmann, J., Czudaj, R., & Arora, V. (2020). The relationship between oil prices and exchange rates: Revisiting theory and evidence. Energy Economics, 88, 104772.
- Ferraro, D., Rogoff, K., & Rossi, B. (2015). Can oil prices forecast exchange rates? An empirical analysis of the relationship between commodity prices and exchange rates. Journal of International Money and Finance, 54, 116-141.
- Slack, D., Hilgard, S., Jia, E., Singh, S., & Lakkaraju, H. (2020). Fooling LIME and SHAP: Adversarial Attacks on Post hoc Explanation Methods. Proceedings of the AAAI/ACM Conference on AI, Ethics, and Society (AIES).
- Pearl, J. (2009). Causality: Models, Reasoning, and Inference (2nd ed.). Cambridge University Press.
- U.S. Energy Information Administration (EIA). (2022). U.S. Imports from Canada of Crude Oil. [Data set].