İçindekiler
1. Giriş
Bu araştırma, ithalata bağımlı Bangladeş ekonomisi için hayati bir görev olan ABD Doları - Bangladeş Takası (USD/BDT) döviz kurunun tahmin edilmesi gibi kritik bir zorluğu ele almaktadır. Döviz kuru dalgalanmaları, doğrudan döviz rezervi yönetimini, ticaret dengesini ve enflasyonu etkiler. Geleneksel istatistiksel modeller, özellikle ekonomik belirsizlik dönemlerinde, gelişmekte olan piyasa para birimlerinin doğrusal olmayan, karmaşık örüntülerini yakalamakta genellikle başarısız olur. Bu çalışma, 2018-2023 dönemine ait tarihsel verileri kullanarak bu dinamik zamansal ilişkileri modellemek için gelişmiş makine öğrenimi, özellikle de Uzun Kısa Süreli Bellek (LSTM) sinir ağlarından yararlanmaktadır.
2. Literatür Taraması
Son literatür, finansal tahminlemede LSTM ağlarının ARIMA gibi geleneksel zaman serisi modellerine üstünlüğünü ortaya koymaktadır. RNN'lerdeki kaybolan gradyan problemini çözmek için Hochreiter & Schmidhuber tarafından geliştirilen LSTM'ler, uzun vadeli bağımlılıkları yakalamada üstündür. Unutma kapıları (Gers ve diğerleri) gibi sonraki iyileştirmeler, oynaklığa uyum sağlama yeteneğini geliştirmiştir. Büyük döviz çiftleri üzerine yapılan deneysel çalışmalar, LSTM'lerin yönsel doğrulukta ARIMA'dan %18–22 daha iyi performans gösterdiğini ortaya koymaktadır. USD/INR gibi para birimleri üzerine araştırmalar mevcut olsa da, USD/BDT üzerine özel çalışmalar sınırlıdır ve genellikle pandemi öncesi veriler kullanmakta, dikkat mekanizmaları veya yerel makroekonomik şoklar gibi modern tekniklerin entegrasyonundan yoksundur.
3. Metodoloji & Veri
3.1. Veri Toplama & Ön İşleme
2018-2023 dönemi için günlük USD/BDT döviz kuru verileri Yahoo Finance'ten temin edilmiştir. Veriler, BDT/USD kurunun yaklaşık 0.012'den 0.009'a düştüğünü göstermektedir. Veri ön işleme, eksik değerlerin ele alınmasını, oynaklığı yakalamak için normalize edilmiş günlük getirilerin hesaplanmasını ve zaman serisi modelleri için diziler oluşturulmasını içermiştir.
3.2. LSTM Model Mimarisi
Temel tahmin modeli bir LSTM sinir ağıdır. Mimari, USD/BDT veri seti için optimize edilmiş olup, muhtemelen birden fazla LSTM katmanı, düzenlileştirme için dropout ve yoğun bir çıktı katmanı içermektedir. Model, geçmiş dizilere dayanarak gelecekteki döviz kuru değerlerini tahmin etmek üzere eğitilmiştir.
3.3. Gradient Boosting Sınıflandırıcı (GBC)
Yönsel tahmin için - döviz kurunun yukarı mı yoksa aşağı mı hareket edeceğini tahmin etmek için - bir Gradient Boosting Sınıflandırıcı kullanılmıştır. Bu modelin performansı, pratik bir işlem simülasyonu ile değerlendirilmiştir.
4. Deneysel Sonuçlar & Analiz
LSTM Doğruluğu
%99.449
LSTM RMSE
0.9858
ARIMA RMSE
1.342
GBC Karlı İşlemler
%40.82
4.1. LSTM Performans Metrikleri
LSTM modeli olağanüstü sonuçlar elde etmiştir: %99.449 doğruluk, 0.9858 Kök Ortalama Kare Hatası (RMSE) ve 0.8523 test kaybı. Bu, USD/BDT kurunun gerçek değerini tahmin etmek için oldukça hassas bir model olduğunu göstermektedir.
4.2. GBC İşlem Simülasyonu
10.000$'lık başlangıç sermayesi üzerinde 49 işlem boyunca GBC'nin yönsel sinyalleri kullanılarak bir geriye dönük test yapılmıştır. İşlemlerin %40.82'si karlı olmasına rağmen, strateji 20.653,25$ net zararla sonuçlanmıştır. Bu, işlem maliyetleri, kayma ve risk yönetiminin çok önemli olduğu tahmin doğruluğu ile karlı işlem yapma arasındaki kritik farkı vurgulamaktadır.
4.3. ARIMA ile Karşılaştırmalı Analiz
LSTM modeli, RMSE'si 1.342 olan geleneksel ARIMA modelini önemli ölçüde geride bırakmıştır. Bu, finansal zaman serisi verilerinde bulunan karmaşık, doğrusal olmayan örüntüleri modellemede derin öğrenmenin açık avantajını göstermektedir.
5. Teknik Detaylar & Matematiksel Çerçeve
LSTM hücresi, bilgi akışını düzenleyen bir kapı mekanizması aracılığıyla çalışır. Temel denklemler şunlardır:
- Unutma Kapısı: $f_t = \sigma(W_f \cdot [h_{t-1}, x_t] + b_f)$
- Giriş Kapısı: $i_t = \sigma(W_i \cdot [h_{t-1}, x_t] + b_i)$, $\tilde{C}_t = \tanh(W_C \cdot [h_{t-1}, x_t] + b_C)$
- Hücre Durumu Güncellemesi: $C_t = f_t * C_{t-1} + i_t * \tilde{C}_t$
- Çıktı Kapısı: $o_t = \sigma(W_o \cdot [h_{t-1}, x_t] + b_o)$, $h_t = o_t * \tanh(C_t)$
Burada $\sigma$ sigmoid fonksiyonudur, $*$ eleman bazında çarpımı, $W$ ağırlık matrislerini, $b$ bias vektörlerini, $x_t$ girdiyi, $h_t$ gizli durumu ve $C_t$ hücre durumunu temsil eder. Bu yapı, ağın uzun diziler boyunca hangi bilgiyi saklayacağını veya atacağını öğrenmesine olanak tanır.
6. Analiz Çerçevesi: Pratik Bir Örnek
Örnek: Makroekonomik Şokların LSTM Sürecine Entegrasyonu
Çalışma, yerel makroekonomik şok tespitinin entegrasyonundan bahsetmektedir. Açık kod olmadan bunun nasıl uygulanabileceğine dair kavramsal bir çerçeve aşağıda verilmiştir:
- Veri Zenginleştirme: Bangladeş için "şok göstergeleri" paralel zaman serisi veri seti oluşturun. Bu, merkez bankası müdahale duyuruları, büyük siyasi olaylar veya döviz akışlarındaki değişiklikler gibi olaylar için haber API'ları veya resmi bültenlerden kaynaklanan ikili (0/1) bayraklar olabilir.
- Öznitelik Mühendisliği: Her işlem günü için, döviz kuru verilerinin tarihsel penceresini, ilgili şok göstergeleri penceresiyle birleştirin. Bu, zenginleştirilmiş bir girdi vektörü oluşturur:
[Fiyat_Dizisi, Şok_Dizisi]. - Model Uyarlaması: LSTM'nin girdi katmanını bu çok boyutlu girdiyi kabul edecek şekilde ayarlayın. Ağ, belirli şok örüntülerini USD/BDT kurundaki sonraki oynaklık veya trend değişiklikleriyle ilişkilendirmeyi öğrenecektir.
- Doğrulama: Şokla zenginleştirilmiş modelin performansını (RMSE, yönsel doğruluk), özellikle şoklarla işaretlenmiş dönemlerde, sadece fiyat verilerini kullanan temel modele karşı karşılaştırın.
7. Gelecekteki Uygulamalar & Araştırma Yönleri
- Çok Modlu Veri Entegrasyonu: Makroekonomik bayrakların ötesinde, finansal haberlerden ve sosyal medyadan gerçek zamanlı duygu analizinin (örneğin BERT gibi Transformer modelleri kullanarak) entegrasyonu, büyük döviz çiftleri üzerine yapılan çalışmalarda görüldüğü gibi piyasa ruh halini yakalayabilir.
- Dikkat Mekanizmaları: Dikkat katmanlarının (Transformer mimarisindekiler gibi) LSTM'ye dahil edilmesi, modelin en ilgili geçmiş zaman adımlarına dinamik olarak odaklanmasına izin vererek, uzun diziler için yorumlanabilirliği ve performansı artırabilir.
- İşlem için Pekiştirmeli Öğrenme: Saf tahminden doğrudan politika öğrenmeye geçiş. Derin Q-Ağı (DQN) gibi bir model, riskle ayarlanmış getirileri (Sharpe Oranı) en üst düzeye çıkaran al/sat/bekle kararları vermek üzere eğitilebilir ve böylece GBC geriye dönük testinde görülen karlılık açığını doğrudan ele alabilir.
- Çapraz Para Birimi Öğrenimi: Birden fazla gelişmekte olan piyasa döviz çifti (ör. USD/INR, USD/PKR) üzerinde eğitilmiş, oynaklık ve politika etkisinin evrensel örüntülerini öğrenen bir meta-model geliştirmek, ardından sınırlı veriyle gelişmiş sağlamlık için USD/BDT üzerinde ince ayar yapmak.
8. Kaynaklar
- Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. Neural Computation.
- Gers, F. A., Schmidhuber, J., & Cummins, F. (2000). Learning to Forget: Continual Prediction with LSTM. Neural Computation.
- Rahman ve diğerleri (Yıl). USD/INR tahminlemesi üzerine LSTM ile çalışma. [İlgili Dergi].
- Afrin ve diğerleri (2021). USD/BDT üzerine pandemi öncesi çalışma. [İlgili Konferans].
- Hosain ve diğerleri (Yıl). Döviz kuru tahmini için hibrit teknikler. [İlgili Dergi].
- Vaswani, A., ve diğerleri (2017). Attention Is All You Need. Advances in Neural Information Processing Systems.
- Mnih, V., ve diğerleri (2015). Human-level control through deep reinforcement learning. Nature.
9. Özgün Analiz & Uzman Yorumu
Temel İçgörü: Bu makale, nokta tahmini için LSTM ağlarının ARIMA gibi eski modeller üzerindeki teknik üstünlüğünü başarıyla göstermekte, ancak istemeden fintek araştırmalarında tehlikeli bir uçurumu ortaya çıkarmaktadır: istatistiksel doğruluk ile ekonomik faydanın birbirine karıştırılması. Bir Gradient Boosting Sınıflandırıcı aracılığıyla bir işlem stratejisine dönüştürüldüğünde başlangıç sermayesinde felaket bir %200+ kayba yol açan %99,45 doğruluğa sahip bir model sadece akademik bir dipnot değil, finans alanında yapay zekayı nasıl değerlendirdiğimiz konusunda temel bir değişim için bir uyarı işaretidir.
Mantıksal Akış & Güçlü Yönler: Araştırma mantığı sağlam ve tekrarlanabilirdir. Yazarlar, BDT gibi doğrusal olmayan, politika duyarlı para birimleri için doğrusal modellerin sınırlamalarını doğru bir şekilde tespit etmektedir. Yönetimli dalgalı rejimi bir vaka çalışması olarak kullanmaları akıllıcadır, çünkü bu piyasalar yapay zeka tarafından dönüştürülmeye hazırdır. Teknik uygulama sağlamdır; LSTM'nin 0.9858'lik (ARIMA'nın 1.342'sine karşı) neredeyse mükemmel RMSE'si, derin öğrenmenin karmaşık zamansal bağımlılıkları modelleme kapasitesinin tartışılmaz kanıtını sağlamakta ve bu bulgu Hochreiter & Schmidhuber'ın orijinal LSTM makalesi gibi temel çalışmalarla tutarlıdır. GBC aracılığıyla bir işlem sonucuna köprü kurma girişimi, gerçek dünya ile ilgili olma yönünde takdir edilesi bir adımdır.
Kritik Kusurlar & Karlılık Paradoksu: Kritik kusur burada yatmaktadır. GBC'nin %40,82 kazanma oranının büyük kayıplarla sonuçlanması, finansal getirilerin asimetrisini göz ardı etmenin klasik bir örneğidir. Bu, entegre risk metriklerinin (ör. Sharpe Oranı, Maksimum Çekilme) eksikliğini ve naif bir uygulama modelini vurgulamaktadır. Bu, sadece tahmin hatasına odaklanan erken dönem yapay zeka finans makalelerindeki yaygın bir tuzağı yansıtmaktadır. Alan, Mnih ve diğerlerinin temel çalışmasında uygulanan Derin Q-Ağı (DQN) çerçevesi gibi, doğrudan portföy getirilerini optimize eden pekiştirmeli öğrenme yaklaşımlarında görüldüğü gibi gelişmiştir. Ayrıca, makale makroekonomik faktörlerden bahsetse de, uygulaması yüzeysel görünmektedir. Merkez bankası müdahalesi ve döviz akışlarından ağırlıklı olarak etkilenen BDT gibi bir para birimi için, bunları yapılandırılmış özellikler olarak derinlemesine entegre etmemek - belki de Transformer mimarisinde önerildiği gibi etkilerini tartmak için bir dikkat mekanizması kullanmak - kaçırılmış bir fırsattır.
Uygulanabilir İçgörüler & İleriye Giden Yol: Uygulayıcılar ve araştırmacılar için bu çalışma iki kritik, uygulanabilir içgörü sunmaktadır. İlk olarak, RMSE sunağına tapınmayı bırakın. Piyasaya yönelik herhangi bir model için birincil değerlendirme metriği, gerçekçi maliyetleri, kaymayı ve pozisyon büyüklüğünü içeren simüle edilmiş bir işlem ortamındaki performansı olmalıdır. Backtrader veya QuantConnect gibi araçlar doğrulama sürecinde tartışılmaz olmalıdır. İkinci olarak, gelecek uçtan uca ajan öğrenmesinde yatmaktadır. Parçalı süreç (LSTM -> GBC -> İşlem) yerine, bir sonraki sınır, ham veya hafif işlenmiş piyasa verilerini alan ve doğrudan risk yönetimli işlem eylemleri çıktılayan tek, bütünsel bir ajan kullanmaktır - muhtemelen Proximal Policy Optimization (PPO) veya benzeri gelişmiş RL algoritmalarına dayalı. Bu ajanın ödül fonksiyonu, riskle ayarlanmış getiri metriklerinin bir bileşimi olacak ve yapay zekayı piyasanın sadece istatistiksel örüntülerini değil, gerçek ekonomisini öğrenmeye zorlayacaktır. Yazarların duygu analizi ekleme önerisi iyi bir başlangıçtır, ancak bu, sadece başka bir özellik sütunu olarak eklenmek yerine, bu ajan tabanlı mimariye kaynaştırılmalıdır. Bu, zeki bir tahminci yaratmaktan uygulanabilir bir finansal ajan mühendisliğine giden yoldur.