1. Giriş
Döviz (Forex) piyasası, yüksek likidite, oynaklık ve karmaşıklık ile karakterize edilen dünyanın en büyük finansal piyasasıdır. Forex fiyat hareketlerini tahmin etmek, sayısız makroekonomik faktörün, jeopolitik olayların ve piyasa duyarlılığının etkisi nedeniyle oldukça zordur. Geleneksel teknik analiz, faydalı olmakla birlikte, genellikle ani piyasa değişimlerine veya "kara kuğu" olaylarına uyum sağlamakta başarısız olur. Bu makale, özellikle olay odaklı ticaret stratejileri için aşırı satış piyasa koşullarını hedefleyerek tahmin doğruluğunu artırmak amacıyla kümeleme teknikleri ile dikkat mekanizmalarını birleştiren yeni bir makine öğrenimi yaklaşımı önermektedir. Model, 2005'ten 2021'e kadar olan tarihsel Forex verilerini ve türetilmiş teknik göstergeleri kullanmaktadır.
2. İlgili Literatür
Araştırma, kantitatif finans alanındaki yerleşik finans teorisi ve makine öğrenimi uygulamaları üzerine inşa edilmiştir.
2.1 Teknik Göstergeler
Teknik göstergeler, finansal piyasa yönünü tahmin etmek için kullanılan, tarihsel fiyat, hacim veya açık pozisyon verilerine dayalı matematiksel hesaplamalardır. Model, birkaç temel göstergeyi içermektedir.
2.1.1 Göreceli Güç Endeksi (RSI)
RSI, fiyat hareketlerinin hızını ve değişimini ölçen bir momentum osilatörüdür. Aşırı alım veya aşırı satım koşullarını belirlemek için kullanılır.
Formül: $RSI = 100 - \frac{100}{1 + RS}$ burada $RS = \frac{\text{N periyottaki Ortalama Kazanç}}{\text{N periyottaki Ortalama Kayıp}}$.
30'un altındaki bir RSI tipik olarak aşırı satım koşulunu (potansiyel alım fırsatı), 70'in üzerindeki bir RSI ise aşırı alım koşulunu (potansiyel satım fırsatı) gösterir.
2.1.2 Basit Hareketli Ortalama (SMA), Üssel Hareketli Ortalama (EMA), MACD
SMA, önceki N veri noktasının ağırlıksız ortalamasıdır. EMA ise yakın tarihli fiyatlara daha fazla ağırlık verir. Hareketli Ortalama Yakınsama Iraksama (MACD) ise trend takip eden bir momentum göstergesidir.
Formül: $MACD = EMA(\text{12 periyot}) - EMA(\text{26 periyot})$.
MACD'nin 9 günlük EMA'sı olan bir Sinyal Çizgisi, ticaret sinyalleri üretmek için kullanılır. MACD ile Sinyal Çizgisi arasındaki kesişmeler, potansiyel yükseliş veya düşüş trendlerini gösterir.
2.1.3 Bollinger Bantları
Bollinger Bantları, ortada bir SMA çizgisi ve tipik olarak 2 standart sapma seviyesinde çizilen iki dış banttan oluşur. Piyasa oynaklığını ölçerler. Bir sıkışma (bantların daralması) genellikle yüksek oynaklık döneminden önce gelirken, fiyatın bantların dışına hareketi bir devam veya tersine dönüş sinyali verebilir.
3. Temel Kavrayış & Mantıksal Akış
Temel Kavrayış: Makalenin temel iddiası, saf fiyat/gösterge zaman serisi modellerinin miyop olduğudur. Önce benzer piyasa rejimlerini (örn., yüksek oynaklıklı aşırı satış, düşük oynaklıklı konsolidasyon) kümeler ve ardından bu bağlamlar içinde bir dikkat mekanizması uygulayarak, model sinyali gürültüden tek parça bir LSTM veya GRU ağından daha etkili bir şekilde ayırabilir. Bu bir tür koşullu modellemedir—ağın davranışı açıkça tanımlanan piyasa durumuna göre şartlandırılmıştır.
Mantıksal Akış: İşlem hattı zarif bir şekilde sıralıdır: 1) Özellik Mühendisliği: Ham OHLC verisi, zengin bir teknik gösterge setine (RSI, MACD, Bollinger Band konumu) dönüştürülür. 2) Rejim Kümelemesi: Bir kümeleme algoritması (muhtemelen K-Ortalama veya Gauss Karışım Modeli), tarihsel dönemleri gösterge profillerine dayanarak farklı durumlara böler. 3) Bağlam Farkındalıklı Tahmin: Belirli bir veri noktası için model önce onun kümesini belirler. Ardından, dikkat tabanlı bir dizi modeli (Transformer kodlayıcı gibi), dikkat ağırlıkları küme kimliği tarafından modüle edilebilecek şekilde, yakın geçmişi işleyerek, aşırı satış durumundan karlı bir ortalamaya dönüş olasılığını tahmin eder.
4. Güçlü Yönler & Zayıflıklar
Güçlü Yönler:
- Mimari Yenilik: Kümeleme ön işlem adımı, kantitatif finansın klasik bir baş ağrısı olan durağan olmama durumunu ele almak için pragmatik bir yoldur. Derin bir ağın rejimleri örtük olarak öğrenmesini ummaktan daha yorumlanabilirdir.
- Uygulanabilir Senaryolara Odaklanma: "Aşırı satış" koşullarını hedeflemek akıllıca bir kısıtlamadır. Bu, açık uçlu bir tahmin problemini daha yönetilebilir bir ikili sınıflandırmaya dönüştürür: "Bu mevcut aşırı satış sinyali gerçek bir alım fırsatı mı yoksa bir tuzak mı?"
- Yerleşik Göstergeler Üzerine Kurulu Olma: İyi bilinen teknik göstergelerin özellik olarak kullanılması, modelin girdilerini geleneksel tüccarlar için anlaşılır kılar ve potansiyel benimsemeyi kolaylaştırır.
Zayıflıklar & Kritik Boşluklar:
- Veri Gözetleme Yanlılığı Tehlikesi: 2005-2021 veri seti, birden fazla krizi (2008, COVID-19) kapsamaktadır. Tamamen görülmemiş piyasa rejimlerinde (örn., savaş ve enflasyonun olduğu 2022-2024) titiz bir ileriye dönük analiz veya örneklem dışı test yapılmadan, aşırı uydurma riski ciddidir.
- Kara Kutu Dikkat: Dikkat katmanları güçlü olsa da, modelin neden belirli geçmiş dönemlere dikkat ettiğini açıklamak zorlu kalmaktadır. Düzenlenmiş finans sektöründe, "açıklanabilirlik" sadece hoş bir özellik değildir.
- Alfa Kaynağı Tartışmasının Eksikliği: Makale, işlem maliyetleri, kayma ve risk yönetimi konularında sessiz kalmaktadır. Geriye dönük testlerde harika görünen bir strateji, gerçek dünya sürtünmeleri tarafından yok edilebilir. Tahmin edilen avantaj, maliyetlerden sonra hayatta kalıyor mu?
5. Uygulanabilir Öngörüler
Kantitatif fonlar ve algoritmik tüccarlar için:
- Rejim-Kümeleme Yaklaşımını Tekrarlayın: Bir sonraki derin tahmin modelinizi oluşturmadan önce, tarihsel verilerinizi rejimlere bölün. Bu basit adım model kararlılığını önemli ölçüde artırabilir. Kümeleme özellikleri için oynaklık, trend gücü ve korelasyon gibi metrikleri kullanın.
- "Rejim Değişimleri" Üzerinde Stres Testi Yapın: Sadece rastgele zaman bölümlerinde test yapmayın. Modelinizin performansını bilinen rejim değişimleri sırasında (örn., 2008 krizine veya 2020 COVID çöküşüne geçiş) kasıtlı olarak test edin. Bu gerçek bir turnusol testidir.
- Temel Verilerle Melezleştirin: Bir sonraki evrim, kümeleme algoritmasına sadece teknik göstergeleri değil, aynı zamanda makro veri parçacıklarını (haberlerden merkez bankası duyarlılığı, getiri eğrisi verileri) de beslemektir. Bu, hem teknik hem de temel koşullarla tanımlanan daha sağlam rejim tanımları oluşturabilir.
- Açıklanabilirlik Talep Edin: Dikkat ağırlıklarını yorumlamak için SHAP veya LIME gibi araçları uygulayın. Model, tahmini için hangi geçmiş günleri önemli buldu? Bu denetim izi hem doğrulama hem de düzenleyici uyumluluk için çok önemlidir.
6. Özgün Analiz
Önerilen model, finansal zaman serilerinde doğal olarak bulunan durağan olmama problemini ele almak için sofistike bir girişimi temsil etmektedir—bu zorluk, Marcos López de Prado'nun "Finansal Makine Öğreniminde İlerlemeler" gibi öncü çalışmalarda vurgulanmıştır. Yazarlar, farklı piyasa rejimlerini tanımlamak için bir ön işlem adımı olarak kümelemeyi kullanarak, etkili bir şekilde koşullu bir mimari yaratmaktadır. Bu kavramsal olarak, finans için geleneksel RNN'ler ile daha modern mimarileri karşılaştıran çalışmalarda da belirtildiği gibi (örn., Borovkova & Tsiamas, 2019), içsel durumunu değişen piyasa dinamiklerine uyarlamakta genellikle zorlanan tek parça bir LSTM'e ham sıralı veri beslemekten üstündür.
NLP'deki Transformer'ların başarısından (Vaswani ve diğerleri, 2017) ilham almış olması muhtemel bir dikkat mekanizmasının entegrasyonu, modelin farklı tarihsel noktaların önemini dinamik olarak ağırlıklandırmasına olanak tanır. Aşırı satış RSI sinyali bağlamında, model, ardından tersine dönüşler gelen benzer geçmiş aşırı satış olaylarına güçlü bir şekilde dikkat etmeyi, daha fazla düşüşe yol açanları ise görmezden gelmeyi öğrenebilir. Bu seçici odaklanma, tüm geçmiş verilere eşit davranan hareketli ortalamalara göre önemli bir ilerlemedir.
Ancak, modelin potansiyeli, eğitim verilerinin kalitesine ve temsil yeteneğine bağlıdır. 2005-2021 dönemi belirli oynaklık rejimlerini içermektedir. Bu veriler üzerinde eğitilmiş bir model, 2022 sonrası yüksek enflasyon, yüksek faiz ortamı gibi yeni bir rejim sırasında başarısız olabilir—bu, makine öğrenimi literatüründe tartışılan alan kayması problemlerine (örn., bilgisayarlı görüde CycleGAN (Zhu ve diğerleri, 2017) ile) benzer bir fenomendir, ancak finans için de eşit derecede kritiktir. Ayrıca, teknik göstergeler değerli olsa da, nihayetinde gecikmelidir. Two Sigma gibi öncü hedge fonlarının yaptığı gibi alternatif veri kaynaklarını dahil etmek, bir sonraki gerekli sıçrama olabilir. Bu mimarinin gerçek testi, görülmemiş piyasa yapılarına genelleme yapabilme yeteneği ve tüm ticaret maliyetleri netindeki performansı olacaktır.
7. Teknik Detaylar & Matematiksel Çerçeve
Temel teknik yenilik, iki aşamalı model mimarisinde yatmaktadır.
Aşama 1: Piyasa Rejimi Kümelemesi
$\mathbf{F}_t = [f^1_t, f^2_t, ..., f^m_t]$, t zamanındaki teknik göstergelerin (RSI, MACD, Bollinger Band konumu, oynaklık vb.) normalize edilmiş değerlerini içeren bir özellik vektörü olsun. Bir kümeleme algoritması $C$ (örn., $k$ kümeli K-Ortalama), tarihsel veriyi $k$ rejime böler:
$C(\mathbf{F}_t) = r_t \in \{1, 2, ..., k\}$.
Her $r$ kümesi, farklı bir piyasa durumunu temsil eder (örn., "yüksek trendli boğa piyasası", "düşük oynaklıklı aralıkta sıkışmış", "aşırı satış yüksek oynaklıklı").
Aşama 2: Dikkat Tabanlı Dizi Tahmini
Yakın tarihli özellik vektörlerinin bir dizisi $\mathbf{X} = [\mathbf{F}_{t-n}, ..., \mathbf{F}_{t-1}, \mathbf{F}_t]$ ve onun ilişkili rejim etiketi $r_t$ için, model bir hedef $y_t$ (örn., aşırı satış sinyalinden sonraki fiyat artışı için ikili etiket) tahmin etmeyi amaçlar. Bir dikkat mekanizması, girdi dizisinin ağırlıklı bir toplamı olarak bir bağlam vektörü $\mathbf{c}_t$ hesaplar:
$\mathbf{c}_t = \sum_{i=t-n}^{t} \alpha_i \mathbf{h}_i$,
burada $\mathbf{h}_i$, $\mathbf{F}_i$'nin gizli bir temsilidir ve dikkat ağırlıkları $\alpha_i$ şu şekilde hesaplanır:
$\alpha_i = \frac{\exp(\text{score}(\mathbf{h}_t, \mathbf{h}_i))}{\sum_{j=t-n}^{t} \exp(\text{score}(\mathbf{h}_t, \mathbf{h}_j))}$.
Skorlama fonksiyonu basit bir nokta çarpımı veya öğrenilmiş bir fonksiyon olabilir. $r_t$ rejimi, başlangıç gizli durumlarını veya dikkat skorlama fonksiyonunu etkileyen bir gömme olarak dahil edilebilir, böylece modelin odak noktası piyasa durumuna koşullu hale getirilir.
8. Analiz Çerçevesi & Vaka Örneği
Senaryo: EUR/USD paritesi, 15 Ekim 2020. RSI 28'e düşerek aşırı satım koşulunu gösteriyor.
Çerçeve Uygulaması:
- Özellik Çıkarımı: Bir özellik vektörü $\mathbf{F}_t$ hesaplanır: RSI=28, MACD histogramı negatif ama yükseliyor, fiyat alt Bollinger Band'ına dokunuyor, 30 günlük oynaklık = %8.
- Rejim Sınıflandırması: 2005-2019 verileri üzerinde eğitilmiş kümeleme modeli, $\mathbf{F}_t$'yi alır ve onu "Orta Oynaklıkta Zayıf Aşağı Yönlü Momentum ile Aşırı Satış" olarak etiketlenmiş Küme #3'e atar.
- Bağlam Farkındalıklı Tahmin: Dikkat tabanlı tahmin edici, şimdi özellikle "Küme #3" koşullandırılmış olarak, son 20 günün verilerini analiz eder. Dikkat katmanı, benzer özellik profillerine sahip olan ve ardından 5 gün içinde %2 fiyat toparlanması gelen 5 ve 12 gün öncesine yüksek ağırlıklar atayabilir.
- Çıktı: Model, başarılı bir ortalamaya dönüş ticaretinin (3 gün içinde >%1 fiyat artışı) yüksek bir olasılığını (örn., %72) çıktılar. Bu, basit bir "RSI < 30" kuralının çok ötesinde, nicelleştirilmiş, bağlam açısından zengin bir sinyal sağlar.
Not: Bu kavramsal bir örnektir. Gerçek model mantığı, eğitilmiş parametreleri tarafından tanımlanır.
9. Gelecekteki Uygulamalar & Yönelimler
Önerilen mimarinin genişletme için umut verici yolları vardır:
- Çoklu Varlık & Çapraz Piyasa Rejimleri: Aynı kümelemeyi ilişkili varlıklara (örn., başlıca döviz çiftleri, endeksler, emtialar) uygulayarak küresel finansal rejimleri tanımlayın ve sistemik risk değerlendirmesini iyileştirin.
- Alternatif Verilerle Entegrasyon: Özellik vektörü $\mathbf{F}_t$'ye kümeleme için gerçek zamanlı haber duyarlılık skorlarını (NLP modellerinden) veya merkez bankası iletişim tonunu dahil ederek, hem teknik hem de temel koşullarla tanımlanan rejimler yaratın.
- Pekiştirmeli Öğrenme (RL) Entegrasyonu: Kümeleme-dikkat modelini, tanımlanan her rejim için optimal ticaret politikalarını (giriş, çıkış, pozisyon büyüklüğü) öğrenen bir RL ajanı içinde durum temsil modülü olarak kullanın, tahminden doğrudan strateji optimizasyonuna geçin.
- Düzenleme için Açıklanabilir Yapay Zeka (XAI): Açıkça şunu gösteren sonradan açıklama arayüzleri geliştirin: "Bu ticaret sinyali, piyasa X Rejiminde olduğu ve model A, B ve C tarihsel kalıplarına odaklandığı için tetiklendi." Bu, düzenlenmiş kurumlarda benimsenme için kritiktir.
- Uyarlanabilir Çevrimiçi Öğrenme: Kümeleme modelinin yeni verilerle artımlı olarak güncellenmesi için mekanizmalar uygulayın, böylece tamamen yeni piyasa rejimlerini gerçek zamanlı olarak tanımasına ve uyum sağlamasına izin verin, model bozulma riskini azaltın.
10. Referanslar
- López de Prado, M. (2018). Advances in Financial Machine Learning. Wiley.
- Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems 30 (NIPS 2017).
- Borovkova, S., & Tsiamas, I. (2019). An ensemble of LSTM neural networks for high-frequency stock market classification. Journal of Forecasting, 38(6), 600-619.
- Zhu, J.-Y., et al. (2017). Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. IEEE International Conference on Computer Vision (ICCV).
- Murphy, J. J. (1999). Technical Analysis of the Financial Markets. New York Institute of Finance.
- Investopedia. (n.d.). Technical Indicators. Retrieved from https://www.investopedia.com.