클러스터링과 어텐션 기반 지능형 외환 트레이딩 모델

1. 서론

외환(Forex) 시장은 높은 유동성, 변동성 및 복잡성을 특징으로 하는 세계 최대의 금융 시장입니다. 수많은 거시경제 요인, 지정학적 이벤트 및 시장 심리의 영향을 받기 때문에 외환 가격 변동을 예측하는 것은 악명 높게 어렵습니다. 전통적인 기술적 분석은 유용하지만, 갑작스러운 시장 변화나 "블랙 스완" 이벤트에 적응하지 못하는 경우가 많습니다. 본 논문은 클러스터링 기법과 어텐션 메커니즘을 결합하여 예측 정확도를 향상시키는 새로운 머신러닝 접근법을 제안하며, 특히 이벤트 기반 트레이딩 전략을 위해 과매도 시장 조건을 타겟팅합니다. 이 모델은 2005년부터 2021년까지의 역사적 외환 데이터와 파생된 기술적 지표를 활용합니다.

2. 관련 문헌

본 연구는 정립된 금융 이론과 정량적 금융 분야의 머신러닝 응용을 기반으로 합니다.

2.1 기술적 지표

기술적 지표는 금융 시장 방향을 예측하는 데 사용되는 역사적 가격, 거래량 또는 미결제약정을 기반으로 한 수학적 계산입니다. 본 모델은 여러 핵심 지표를 통합합니다.

2.1.1 상대강도지수 (RSI)

RSI는 가격 변동의 속도와 변화를 측정하는 모멘텀 오실레이터입니다. 과매수 또는 과매도 조건을 식별하는 데 사용됩니다.

공식: $RSI = 100 - \frac{100}{1 + RS}$ 여기서 $RS = \frac{\text{N 기간 동안의 평균 이익}}{\text{N 기간 동안의 평균 손실}}$.

RSI가 30 미만이면 일반적으로 과매도 상태(잠재적 매수 기회)를 나타내며, RSI가 70을 초과하면 과매수 상태(잠재적 매도 기회)를 시사합니다.

2.1.2 단순이동평균 (SMA), 지수이동평균 (EMA), MACD

SMA는 이전 N개 데이터 포인트의 가중치가 적용되지 않은 평균입니다. EMA는 최근 가격에 더 많은 가중치를 부여합니다. 이동평균수렴확산지표 (MACD)는 추세 추종 모멘텀 지표입니다.

공식: $MACD = EMA(\text{12 기간}) - EMA(\text{26 기간})$.

신호선(MACD의 9일 EMA)은 트레이딩 신호를 생성하는 데 사용됩니다. MACD와 신호선 간의 교차는 잠재적인 강세 또는 약세 추세를 나타냅니다.

2.1.3 볼린저 밴드

볼린저 밴드는 중간 SMA 선과 표준 편차 수준(일반적으로 2)에 그려진 두 개의 외부 밴드로 구성됩니다. 이는 시장 변동성을 측정합니다. 밴드가 좁아지는 "스퀴즈"는 종종 높은 변동성 시기를 예고하며, 밴드 외부의 가격 움직임은 추세 지속 또는 반전을 신호할 수 있습니다.

3. 핵심 통찰 및 논리적 흐름

핵심 통찰: 본 논문의 근본적인 가정은 순수한 가격/지표 시계열 모델은 근시안적이라는 것입니다. 먼저 유사한 시장 레짐(예: 고변동성 과매도, 저변동성 횡보)을 클러스터링한 다음, 그 맥락 내에서 어텐션 메커니즘을 적용함으로써, 이 모델은 단일 LSTM 또는 GRU 네트워크보다 더 효과적으로 신호를 노이즈로부터 분리할 수 있습니다. 이는 조건부 모델링의 한 형태입니다. 네트워크의 동작은 식별된 시장 상태에 따라 명시적으로 조건화됩니다.

논리적 흐름: 파이프라인은 우아하게 순차적입니다: 1) 특성 공학: 원시 OHLC 데이터는 풍부한 기술적 지표(RSI, MACD, 볼린저 밴드 위치) 세트로 변환됩니다. 2) 레짐 클러스터링: 클러스터링 알고리즘(아마도 K-평균 또는 가우시안 혼합 모델)은 지표 프로파일을 기반으로 역사적 기간을 구별되는 상태로 분할합니다. 3) 맥락 인식 예측: 주어진 데이터 포인트에 대해 모델은 먼저 해당 클러스터를 식별합니다. 그런 다음, 어텐션 기반 시퀀스 모델(예: 트랜스포머 인코더)이 최근 기록을 처리하며, 그 어텐션 가중치는 클러스터 식별자에 의해 조절될 수 있어, 과매도 상태에서 수익성 있는 평균 회귀 확률을 예측합니다.

4. 강점 및 한계

강점:

아키텍처적 신규성: 클러스터링 전처리 단계는 정량 금융의 고전적인 난제인 비정상성 처리를 도입하는 실용적인 방법입니다. 이는 딥 네트워크가 레짐을 암묵적으로 학습하기를 바라는 것보다 해석 가능성이 높습니다.
실행 가능한 시나리오에 초점: "과매도" 조건을 타겟팅하는 것은 현명한 제약 조건입니다. 이는 열린 예측 문제를 더 다루기 쉬운 이진 분류 문제로 전환합니다: "이 현재 과매도 신호는 진정한 매수 기회인가, 함정인가?"
정립된 지표 기반: 잘 알려진 기술적 지표를 특성으로 사용함으로써 모델의 입력이 전통적 트레이더에게 이해 가능해져 잠재적 채택이 용이해집니다.

한계 및 치명적 격차:

데이터 스누핑 편향 위험: 2005-2021 데이터셋은 여러 위기(2008년, COVID-19)를 포함합니다. 완전히 새로운 시장 레짐(예: 전쟁과 인플레이션이 있는 2022-2024년)에 대한 엄격한 워크포워드 분석 또는 표본 외 테스트 없이는 과적합 위험이 심각합니다.
블랙박스 어텐션: 어텐션 레이어는 강력하지만, 모델이 왜 특정 과거 기간에 주의를 기울였는지 설명하는 것은 여전히 어려운 과제입니다. 규제된 금융에서는 "설명 가능성"은 단순히 좋은 것이 아니라 필수입니다.
알파 소스 논의 부재: 본 논문은 거래 비용, 슬리피지 및 위험 관리에 대해 침묵합니다. 백테스트에서는 훌륭해 보이는 전략도 실제 마찰로 인해 무너질 수 있습니다. 예측된 우위가 비용 후에도 살아남을 수 있을까요?

5. 실행 가능한 통찰

정량 펀드 및 알고리즘 트레이더를 위해:

레짐-클러스터링 접근법 재현: 다음 딥 예측 모델을 구축하기 전에, 역사적 데이터를 레짐으로 분할하십시오. 이 간단한 단계는 모델 안정성을 극적으로 향상시킬 수 있습니다. 변동성, 추세 강도, 상관관계와 같은 지표를 클러스터링 특성으로 사용하십시오.
"레짐 전환" 시 스트레스 테스트: 무작위 시간 분할로만 테스트하지 마십시오. 알려진 레짐 전환 기간(예: 2008년 위기 또는 2020년 COVID 붕괴로의 전환) 동안 모델 성능을 의도적으로 테스트하십시오. 이것이 진정한 리트머스 테스트입니다.
기초 데이터와의 혼합: 다음 진화 단계는 클러스터링 알고리즘에 기술적 지표뿐만 아니라 거시경제 데이터 스니펫(뉴스의 중앙은행 심리, 수익률 곡선 데이터)도 입력하는 것입니다. 이는 기술적 및 기초적 조건 모두에 의해 정의된 더 강력한 레짐 정의를 생성할 수 있습니다.
설명 가능성 요구: SHAP 또는 LIME과 같은 도구를 구현하여 어텐션 가중치를 해석하십시오. 모델이 예측에 중요하다고 판단한 과거 날짜는 언제입니까? 이 감사 추적은 검증 및 규제 준수를 위해 중요합니다.

6. 원본 분석

제안된 모델은 금융 시계열에 내재된 비정상성 문제를 해결하려는 정교한 시도를 나타냅니다. 이는 Marcos López de Prado의 "Advances in Financial Machine Learning"과 같은 선구적 저작에서 강조된 과제입니다. 저자들은 구별되는 시장 레짐을 식별하기 위한 전처리 단계로 클러스터링을 사용함으로써 효과적으로 조건부 아키텐처를 생성합니다. 이는 개념적으로 원시 순차 데이터를 단일 LSTM에 공급하는 것보다 우수합니다. 전통적 RNN과 금융 분야를 위한 더 현대적 아키텐처를 비교한 연구(예: Borovkova & Tsiamas, 2019)에서 언급된 바와 같이, 단일 LSTM은 변화하는 시장 역학에 내부 상태를 적응시키는 데 종종 어려움을 겪습니다.

NLP에서 트랜스포머의 성공(Vaswani 외, 2017)에서 영감을 받은 어텐션 메커니즘의 통합은 모델이 다양한 역사적 지점의 중요성을 동적으로 가중치를 부여할 수 있게 합니다. 과매도 RSI 신호의 맥락에서, 모델은 반전이 뒤따른 유사한 과거 과매도 이벤트에 강하게 주의를 기울이는 동시에 추가 하락으로 이어진 이벤트는 무시하도록 학습할 수 있습니다. 이 선택적 초점은 모든 과거 데이터를 동등하게 취급하는 이동평균보다 중요한 발전입니다.

그러나 모델의 잠재력은 훈련 데이터의 품질과 대표성에 달려 있습니다. 2005-2021 기간은 특정 변동성 레짐을 포함합니다. 이 데이터로 훈련된 모델은 2022년 이후의 고인플레이션, 고금리 환경과 같은 새로운 레짐 동안 실패할 수 있습니다. 이는 머신러닝 문헌(예: 컴퓨터 비전의 CycleGAN(Zhu 외, 2017))에서 논의되는 도메인 시프트 문제와 유사하지만 금융에서도 동등하게 중요한 현상입니다. 더욱이, 기술적 지표는 가치가 있지만 궁극적으로 지표입니다. Two Sigma와 같은 선도적인 헤지펀드가 하는 것처럼 대체 데이터 소스를 통합하는 것이 다음 필요한 도약이 될 수 있습니다. 이 아키텐처의 진정한 시험은 보이지 않는 시장 구조에 일반화하는 능력과 모든 거래 비용을 차감한 성과에 있을 것입니다.

7. 기술적 세부사항 및 수학적 프레임워크

핵심 기술적 혁신은 두 단계 모델 아키텐처에 있습니다.

1단계: 시장 레짐 클러스터링
$\mathbf{F}_t = [f^1_t, f^2_t, ..., f^m_t]$를 시간 $t$에서의 특성 벡터라고 하자. 이는 기술적 지표(RSI, MACD, 볼린저 밴드 위치, 변동성 등)의 정규화된 값을 포함합니다. 클러스터링 알고리즘 $C$(예: $k$개의 클러스터를 가진 K-평균)는 역사적 데이터를 $k$개의 레짐으로 분할합니다:
$C(\mathbf{F}_t) = r_t \in \{1, 2, ..., k\}$.
각 클러스터 $r$은 구별되는 시장 상태(예: "고추세 강세장", "저변동성 횡보장", "과매도 고변동성")를 나타냅니다.

2단계: 어텐션 기반 시퀀스 예측
최근 특성 벡터 시퀀스 $\mathbf{X} = [\mathbf{F}_{t-n}, ..., \mathbf{F}_{t-1}, \mathbf{F}_t]$ 및 그와 관련된 레짐 레이블 $r_t$에 대해, 모델은 타겟 $y_t$(예: 과매도 신호 후 가격 상승에 대한 이진 레이블)를 예측하는 것을 목표로 합니다. 어텐션 메커니즘은 입력 시퀀스의 가중 합으로 컨텍스트 벡터 $\mathbf{c}_t$를 계산합니다:
$\mathbf{c}_t = \sum_{i=t-n}^{t} \alpha_i \mathbf{h}_i$,
여기서 $\mathbf{h}_i$는 $\mathbf{F}_i$의 은닉 표현이며, 어텐션 가중치 $\alpha_i$는 다음에 의해 계산됩니다:
$\alpha_i = \frac{\exp(\text{score}(\mathbf{h}_t, \mathbf{h}_i))}{\sum_{j=t-n}^{t} \exp(\text{score}(\mathbf{h}_t, \mathbf{h}_j))}$.
스코어링 함수는 단순 내적 또는 학습된 함수일 수 있습니다. 레짐 $r_t$는 초기 은닉 상태나 어텐션 스코어링 함수에 영향을 미치는 임베딩으로 통합될 수 있어, 모델의 초점이 시장 상태에 따라 조건화되도록 합니다.

8. 분석 프레임워크 및 사례 예시

시나리오: EUR/USD 통화쌍, 2020년 10월 15일. RSI가 28로 하락하여 과매도 상태를 나타냅니다.

프레임워크 적용:

특성 추출: 특성 벡터 $\mathbf{F}_t$ 계산: RSI=28, MACD 히스토그램 음수이지만 상승 중, 가격이 하단 볼린저 밴드에 접촉, 30일 변동성 = 8%.
레짐 분류: 2005-2019 데이터로 훈련된 클러스터링 모델이 $\mathbf{F}_t$를 취하여 클러스터 #3에 할당합니다. 이 클러스터는 "약한 하락 모멘텀을 동반한 중간 변동성 과매도"로 레이블링되었습니다.
맥락 인식 예측: 이제 "클러스터 #3"에 특별히 조건화된 어텐션 기반 예측기가 지난 20일간의 데이터를 분석합니다. 어텐션 레이어는 5일과 12일 전 날짜에 높은 가중치를 할당할 수 있습니다. 이 날짜들은 유사한 특성 프로파일을 가지고 있었고 5일 이내에 2%의 가격 반등이 뒤따랐습니다.
출력: 모델은 성공적인 평균 회귀 트레이드(3일 이내 가격 상승 >1%)의 높은 확률(예: 72%)을 출력합니다. 이는 단순한 "RSI < 30" 규칙을 훨씬 넘어서는 정량화되고 맥락이 풍부한 신호를 제공합니다.

참고: 이는 개념적 예시입니다. 실제 모델 논리는 훈련된 매개변수에 의해 정의됩니다.

9. 미래 적용 및 방향성

제안된 아키텐처는 확장을 위한 유망한 방향을 가지고 있습니다:

다중 자산 및 교차 시장 레짐: 상관관계가 있는 자산(예: 주요 외환쌍, 지수, 상품)에 동일한 클러스터링을 적용하여 글로벌 금융 레짐을 식별하고 시스템 리스크 평가를 개선합니다.
대체 데이터와의 통합: 실시간 뉴스 감성 점수(NLP 모델에서) 또는 중앙은행 커뮤니케이션 톤을 특성 벡터 $\mathbf{F}_t$에 통합하여 클러스터링에 사용함으로써, 기술적 및 기초적 조건 모두에 의해 정의된 레짐을 생성합니다.
강화 학습 (RL) 통합: 클러스터링-어텐션 모델을 강화 학습 에이전트 내의 상태 표현 모듈로 사용하여, 각 식별된 레짐에 대한 최적의 트레이딩 정책(진입, 퇴장, 포지션 사이징)을 학습함으로써 예측에서 직접 전략 최적화로 이동합니다.
규제를 위한 설명 가능한 AI (XAI): "이 거래 신호는 시장이 레짐 X에 있고, 모델이 역사적 패턴 A, B, C에 초점을 맞췄기 때문에 트리거되었습니다."라고 명확히 보여주는 사후 설명 인터페이스를 개발합니다. 이는 규제된 기관에서의 채택에 중요합니다.
적응형 온라인 학습: 클러스터링 모델이 새로운 데이터로 점진적으로 업데이트되도록 메커니즘을 구현하여, 완전히 새로운 시장 레짐을 실시간으로 인식하고 적응할 수 있게 하여 모델 성능 저하 위험을 완화합니다.

10. 참고문헌

López de Prado, M. (2018). Advances in Financial Machine Learning. Wiley.
Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems 30 (NIPS 2017).
Borovkova, S., & Tsiamas, I. (2019). An ensemble of LSTM neural networks for high-frequency stock market classification. Journal of Forecasting, 38(6), 600-619.
Zhu, J.-Y., et al. (2017). Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. IEEE International Conference on Computer Vision (ICCV).
Murphy, J. J. (1999). Technical Analysis of the Financial Markets. New York Institute of Finance.
Investopedia. (n.d.). Technical Indicators. Retrieved from https://www.investopedia.com.