목차
1. 서론
환율 예측은 금융 시스템의 복잡성, 비선형성, 빈번한 구조적 변화로 인해 악명 높게 어려운 과제입니다. 전통적인 계량경제학 모델은 이러한 도전에 종종 어려움을 겪으며 투명성이 부족합니다. 본 연구는 이러한 격차를 해소하기 위해 해석 가능한 머신러닝(ML) 프레임워크 내에서 캐나다-미국 달러(CAD/USD) 환율에 대한 기초 변수 기반 모델을 개발합니다. 주요 목표는 정확한 예측을 달성하는 것뿐만 아니라 모델의 결정에 대한 이론과 일관된 설명을 제공하여 정책 입안자와 경제학자들의 신뢰와 실행 가능한 통찰력을 높이는 것입니다.
이 연구는 캐나다가 주요 상품 수출국, 특히 원유 수출국이라는 점에서 동기를 얻었습니다. 원유는 2019년 총 수출의 14.1%를 차지했습니다. 상품 가격(특히 원유)과 캐나다 달러 간의 역동적 관계는 잘 알려져 있지만 복잡하며, 선형 모델로 포착하기 어려운 비선형적이고 시변(time-varying) 특성을 종종 나타냅니다.
2. 방법론 및 프레임워크
2.1 해석 가능한 머신러닝 접근법
핵심 방법론은 예측 머신러닝 모델(예: 그래디언트 부스팅, 랜덤 포레스트, 신경망)과 사후 해석 가능성 기술을 결합합니다. "블랙박스" 모델과 달리, 이 접근법은 SHAP (SHapley Additive exPlanations) 및 LIME (Local Interpretable Model-agnostic Explanations)과 같은 도구를 사용하여 각 거시경제 변수가 개별 예측에 기여하는 정도를 정량화합니다. 이를 통해 특정 시점에 환율 변동을 주도하는 요인을 세밀하게 이해할 수 있습니다.
2.2 데이터 및 변수
모델은 CAD/USD 환율에 영향을 미칠 것으로 가정되는 일련의 거시경제 및 금융 변수를 포함합니다. 주요 변수는 다음과 같습니다:
- 상품 가격: 원유 가격(WTI/Brent), 금 가격.
- 금융 지표: S&P/TSX 종합 지수(캐나다 주식 시장), 미국 주가지수, 이자율 차이(캐나다 대 미국).
- 거시경제 기초 변수: GDP 성장률 차이, 인플레이션율, 무역수지 데이터.
- 시장 심리 및 리스크: VIX 지수(변동성).
데이터는 중앙은행(캐나다 은행, 연방준비제도), 통계 기관(캐나다 통계청) 및 금융 시장 데이터베이스에서 수집된 것으로 보입니다.
2.3 모델 아키텍처 및 학습
본 연구는 지도 학습 설정을 사용하며, 목표 변수는 CAD/USD 환율의 미래 변화 또는 수준입니다. 특징 집합은 거시경제 변수의 시차 값을 포함합니다. 데이터셋은 견고한 표본 외 평가를 위해 훈련, 검증 및 테스트 세트로 분할됩니다. Ablation 연구가 수행되어 해석 가능성 결과를 기반으로 변수를 체계적으로 제거하여 모델을 정제하고 예측 정확도를 향상시킵니다.
3. 실험 결과 및 분석
3.1 예측 성능
해석 가능한 ML 모델은 선형 회귀, 벡터 자기회귀(VAR) 또는 랜덤 워크 모델과 같은 전통적인 벤치마크에 비해 우수한 예측 정확도를 보여줍니다. 주요 성능 지표(예: 평균 제곱근 오차 - RMSE, 평균 절대 오차 - MAE, 방향 정확도)가 보고되며, 통계적으로 유의미한 개선을 보여줍니다.
모델 성능 요약
기준 모델 (랜덤 워크): RMSE = X.XX
제안된 해석 가능 ML 모델: RMSE = Y.YY (개선: ZZ%)
3.2 변수 중요도 및 해석 가능성
해석 가능성 분석은 주도 요인의 명확한 위계를 보여줍니다:
- 원유 가격: 가장 중요한 결정 요인입니다. 그 기여도는 시변적이며, 부호와 크기의 변화는 상품 시장의 주요 사건(예: 2014년 유가 폭락, OPEC+ 결정, 캐나다의 파이프라인 개발)과 일치합니다.
- 금 가격: 두 번째로 중요한 변수로, 안전자산 및 상품 통화 영향으로 작용합니다.
- S&P/TSX 종합 지수: 세 번째 주요 동인으로, 캐나다 기업 부문의 건전성과 자본 흐름을 반영합니다.
차트 설명: SHAP 요약 플롯은 이 위계를 시각적으로 표시할 것입니다. 각 점은 데이터 인스턴스(기간)를 나타냅니다. x축은 SHAP 값(모델 출력에 대한 영향)을 보여주고, y축은 전역 중요도에 따라 정렬된 특징을 나열합니다. 색상은 특징 값을 나타냅니다(빨강=높음, 파랑=낮음). 원유의 경우, 양의 SHAP 값과 음의 SHAP 값 모두에 걸쳐 점들이 분포하는 것은 그 시변 효과를 입증할 것입니다.
3.3 Ablation 연구 결과
Ablation 연구는 해석 가능성 결과를 확인시켜 줍니다. 상위 특징(원유, 금, TSX)을 순차적으로 제거하면 모델 정확도가 가장 급격히 하락하여 그들의 중요한 역할을 검증합니다. 반대로, 덜 중요한 변수를 제거하는 것은 미미한 영향만을 미쳐 보다 간결하고 효율적인 최종 모델을 가능하게 합니다.
4. 주요 통찰 및 논의
본 연구는 환율 예측을 위한 ML의 "블랙박스"를 성공적으로 해체합니다. 주요 통찰은 원유가 캐나다의 경제 구조와 일관되게 CAD/USD 환율의 지배적이고 비선형적이며 상태 의존적인 동인이라는 점입니다. 해석 가능성 프레임워크는 인과 관계와 유사한 서사를 제공합니다. 예를 들어, 원유 가격 상승이 언제 캐나다 달러를 강화시키는지(리스크 온, 수요 주도 랠리 동안) 그리고 언제 그렇지 않은지(상품 효과를 압도하는 글로벌 리스크 오프 사건 동안)를 보여줍니다. 이는 ML 예측과 경제 이론 사이의 간극을 메워줍니다.
5. 기술적 세부사항 및 수학적 프레임워크
예측 모델은 다음과 같이 표현될 수 있습니다: $\hat{y}_t = f(\mathbf{x}_{t-k}) + \epsilon_t$, 여기서 $\hat{y}_t$는 예측된 환율 수익률, $f(\cdot)$는 ML 모델(예: 그래디언트 부스팅 함수), $\mathbf{x}_{t-k}$는 시차된 거시경제 특징의 벡터, $\epsilon_t$는 오차항입니다.
해석 가능성은 협력 게임 이론에 기반한 SHAP 값을 사용하여 달성됩니다. 특징 $i$에 대한 SHAP 값 $\phi_i$는 다음과 같이 계산됩니다: $$\phi_i = \sum_{S \subseteq N \setminus \{i\}} \frac{|S|! (|N|-|S|-1)!}{|N|!} [f(S \cup \{i\}) - f(S)]$$ 여기서 $N$은 모든 특징의 집합, $S$는 $i$를 제외한 특징의 부분집합, $f(S)$는 특징 부분집합 $S$를 사용한 모델 예측입니다. 이는 각 특징에 대한 예측 차이의 공정한 할당을 제공합니다.
6. 분석 프레임워크: 예시 사례 연구
시나리오: 2020년 1분기 CAD/USD 평가절하 분석.
- 입력: 2019년 말/4분기 특징 집합: 급락한 WTI 유가(코로나19 수요 충격), 상승하는 VIX(리스크 오프), 하락하는 TSX.
- 모델 예측: 상당한 캐나다 달러 약세를 예측합니다.
- 해석 가능성 출력 (SHAP):
- 원유: 높은 음의 기여도 (-50 pips). 낮은 유가 값이 예측을 강력하게 하락시킵니다.
- VIX: 음의 기여도 (-20 pips). 높은 회피 성향은 상품 통화에 타격을 줍니다.
- TSX: 음의 기여도 (-15 pips).
- 금: 작은 양의 기여도 (+5 pips). 그 안전자산 역할이 약간의 상쇄 효과를 제공합니다.
- 통찰: 모델의 예측은 투명하게 주로 유가 폭락에 기인하며, 광범위한 리스크 오프 심리로 맥락화되어 관찰된 시장 서사와 완벽하게 일치합니다.
7. 향후 적용 및 연구 방향
- 실시간 정책 대시보드: 중앙은행은 이러한 해석 가능 모델을 통화에 대한 주요 동인 기여도를 실시간으로 모니터링하는 대시보드에 통합하여 개입 결정에 정보를 제공할 수 있습니다.
- 다중 통화 프레임워크: 방법론을 일련의 상품 통화(AUD, NOK, RUB) 및 주요 통화(EUR, JPY)로 확장하여 글로벌 매크로 리스크 모델을 개발합니다.
- 대체 데이터 통합: 선박 운임, 원유 재고 위성 이미지 또는 뉴스 감성 점수를 통합하여 특징 집합을 향상시킵니다.
- 인과 관계 발견: 상관 관계를 넘어서 더 강력한 인과적 연결을 확립하기 위해 인과 추론 기술(예: Peter-Clark 알고리즘)과 결합합니다.
- 설명 가능한 AI(XAI) 표준: 이 작업은 금융 분야에서 성장하는 XAI 분야에 기여하며, MIT-IBM Watson AI Lab과 같은 기관의 연구에서 강조하는 바와 같이 중요한 영역에서 신뢰할 수 있고 감사 가능한 AI 시스템의 필요성을 강조합니다.
8. 참고문헌
- Neghaba, D. P., Cevik, M., & Wahab, M. I. M. (2023). Explaining Exchange Rate Forecasts with Macroeconomic Fundamentals Using Interpretive Machine Learning. arXiv preprint arXiv:2303.16149.
- Lundberg, S. M., & Lee, S. I. (2017). A unified approach to interpreting model predictions. Advances in neural information processing systems, 30.
- Chen, S. S., & Chen, H. C. (2007). Oil prices and real exchange rates. Energy economics, 29(3), 390-404.
- Bank of Canada. (2022). Monetary Policy Report.
- U.S. Energy Information Administration. (2022). U.S. Imports from Canada of Crude Oil.
- Ribeiro, M. T., Singh, S., & Guestrin, C. (2016). "Why should I trust you?" Explaining the predictions of any classifier. Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining.
9. 애널리스트 관점: 핵심 통찰, 논리적 흐름, 강점 및 한계, 실행 가능한 통찰
핵심 통찰: 이 논문은 계량 금융에서 강력하지만 종종 간과되는 진실을 전달합니다: 캐나다와 같은 자원 의존 경제의 경우, 환율은 복잡한 미스터리가 아닙니다—그것은 다른 잡음 변수들로 둘러싸인 단일 상품에 대한 레버리지 베팅입니다. 저자들은 해석 가능한 ML을 새로운 동인을 찾기 위해 사용하는 것이 아니라, 전통적인 계량경제학이 따라올 수 없는 정밀도로 원유의 비선형적, 체제 의존적 지배력을 정량화하고 검증하기 위해 사용합니다. 이것은 단순한 예측이 아닙니다; 숫자로 하는 경제 스토리텔링입니다.
논리적 흐름: 논증은 설득력 있게 단순합니다: 1) 혼란스러운 외환 시장에서 선형 모델의 예측 실패를 인정합니다. 2) 정확도 향상을 위해 ML의 패턴 인식 능력을 배치합니다. 3) SHAP/LIME을 사용하여 "블랙박스"를 열고 "모델이 실제로 무엇을 배웠는가?"라고 묻습니다. 4) 모델의 지능이 주로 가장 명백한 기초 변수 이야기—원유 의존성—에 매핑된다는 것을 발견합니다. 우아함은 고전적인 경제적 직관을 대체하지 않고 강화하기 위해 최첨단 기술을 사용하는 데 있습니다.
강점 및 한계: 주요 강점은 실용적인 하이브리드 접근법으로, ML의 예측력과 정책 입안자들이 요구하는 설명의 필요성을 결합한 것입니다. Ablation 연구는 특히 견고한 접점입니다. 그러나 한계는 잠재적인 인과 관계의 환상에 있습니다. SHAP는 모델의 프레임워크 내에서의 상관 관계를 설명할 뿐, 진정한 인과 관계를 설명하지는 않습니다. 모델이 허위 상관 관계(예: 아이스크림 판매와 캐나다 달러 사이)를 학습하면, SHAP는 성실하게 그것을 설명할 것입니다. 이 논문은 Judea Pearl의 연구와 같이 선구적인 인과 관계 발견 방법을 초기에 통합하여 동인과 단순한 상관 변수를 구별한다면 더 강력해질 수 있습니다.
실행 가능한 통찰: 펀드 매니저를 위해: 루니(캐나다 달러)를 지나치게 복잡하게 생각하지 마십시오. 원유 기초 변수에 대한 핵심 캐나다 달러 전망을 구축하고 이 해석 가능한 프레임워크를 사용하여 그 전망에 대한 2차 요인(금, 리스크 심리)의 가중치를 동적으로 조정하십시오. 기업을 위해: 시나리오 분석을 위해 이 방법론을 사용하십시오—해석된 모델을 통해 다양한 유가 경로를 실행하여 확률적 헤징 예산을 생성하십시오. 규제 기관을 위해: 이것은 거시건전성 정책에서 감사 가능한 AI를 위한 청사진입니다. 체계적 리스크 평가를 위해 어떤 ML을 배치하기 전에, 모델이 실제로 무엇에 민감한지 이해하기 위해 이 수준의 해석 가능성을 요구하십시오. 미래는 단순히 AI 기반 예측이 아닙니다; AI로 설명되는 결정입니다.