3.1. Veri Ön İşleme
Ham Forex verileri temizlenir, normalize edilir ve LSTM girişi için uygun sıralı zaman adımları halinde yapılandırılır. Özellik mühendisliği, teknik göstergeleri (örneğin, hareketli ortalamalar, RSI) içerebilir.
Günlük işlem hacmi 5 trilyon doları aşan Döviz (Forex) piyasası, küresel olarak en büyük ve en likit finansal piyasadır. EUR/USD gibi majör pariteler başta olmak üzere döviz kurlarının doğru tahmini, risk yönetimi ve getirilerin maksimize edilmesi için hayati öneme sahiptir. Bu çalışma, bu görev için Uzun Kısa Vadeli Bellek (LSTM) sinir ağlarının uygulamasını, çift odaklı olarak araştırmaktadır: tahmin doğruluğunu optimize etmek ve modelin hesaplama enerji tüketimi üzerindeki etkilerini değerlendirmek. Araştırma, finansal tahminle sürdürülebilir bilişim uygulamalarını birleştirmeyi amaçlamaktadır.
Forex tahmini, geleneksel teknik ve temel analizden karmaşık makine öğrenimi tekniklerine doğru evrim geçirmiştir. İlk modeller istatistiksel zaman serisi yöntemlerine (örn. ARIMA) dayanıyordu. Yapay Sinir Ağları (ANNs) ve Destek Vektör Makinelerinin (SVMs) ortaya çıkışı önemli bir dönüm noktası oldu. Son zamanlarda, derin öğrenme modelleri, özellikle LSTMs ve hibritleri (örn. LSTM-RCN), oynak finansal verilerdeki uzun vadeli zamansal bağımlılıkları yakalama yetenekleri nedeniyle öne çıkmıştır—bu, daha basit modellere göre kritik bir avantajdır.
Çalışma, tarihi EUR/USD döviz kuru verilerini kullanarak denetimli bir öğrenme yaklaşımı benimsemektedir.
Ham Forex verileri temizlenir, normalize edilir ve LSTM girişi için uygun sıralı zaman adımları halinde yapılandırılır. Özellik mühendisliği, teknik göstergeleri (örneğin, hareketli ortalamalar, RSI) içerebilir.
Çok katmanlı bir LSTM mimarisi tasarlanmıştır. Model, sıra işleme için LSTM katmanlarını ve ardından çıktı tahmini için Yoğun katmanları içerir. Katman sayısı, birim sayısı ve dropout oranları gibi hiperparametreler ayarlanır.
Model performansı, üç temel metrik kullanılarak titizlikle değerlendirilir:
90 epoch boyunca eğitilmiş optimize edilmiş LSTM modeli, temel modellere (örn. basit RNN, ARIMA) kıyasla üstün performans sergiledi. Temel sonuçlar şunları içerir:
Çalışma, derin öğrenmenin hesaplama maliyeti olan kritik ve genellikle gözden kaçan bir yönü vurgulamaktadır. Karmaşık LSTM modellerinin eğitilmesi önemli GPU/CPU kaynakları gerektirir ve bu da yüksek enerji tüketimine yol açar. Makale, model optimizasyonunun (örneğin, verimli mimari, 90 epoch'ta erken durdurma) yalnızca doğruluğu artırmakla kalmayıp aynı zamanda hesaplama yükünü azaltarak, ilgili enerji ayak izini düşürdüğünü ve algoritmik ticarette çevresel sürdürülebilirliğe katkıda bulunduğunu savunmaktadır.
Temel İçgörü: Bu makalenin gerçek değeri, sadece "LSTM finans alanında temel modeli geçti" gibi bir sonuç değildir. Temel öngörüsü, model optimizasyonunu çift amaçlı bir problem olarak çerçevelemesidir: tahmin gücünü en üst düzeye çıkarmak ve aynı zamanda hesaplama enerji tüketimini en aza indirmek. Yapay zekanın karbon ayak izinin sorgulandığı bir dönemde (örneğin ML CO2 Impact girişimi), bu, hedefi yalnızca doğruluktan verimli doğruluk.
Mantıksal Akış: Argüman mantıksal olarak ilerliyor: 1) Forex tahmini değerli ancak hesaplama açısından yoğundur. 2) LSTMs, dizi tahmini için en gelişmiş yöntemlerdir. 3) Onları optimize edebiliriz (mimari, epoch sayısı). 4) Optimizasyon metrikleri (MSE, MAE, R²) iyileştirir. 5) Daha da önemlisi, bu aynı optimizasyon gereksiz hesaplamayı azaltarak enerji tasarrufu sağlar. 6) Bu, daha geniş Yeşil YZ ilkeleriyle uyumludur. Model verimliliği ile enerji verimliliği arasındaki bağlantı ikna edici bir şekilde kurulmuştur.
Strengths & Flaws: Güçlü Yön: Disiplinler arası bakış açısı öngörülü ve gereklidir. Finansal teknolojiyi sürdürülebilir bilişim ile bağlantılandırır. Standart metriklerin (MSE, MAE, R²) kullanımı, performans iddialarının doğrulanabilir olmasını sağlar. Önemli Eksiklik: Makale, dikkat çekici şekilde yetersiz kalmaktadır. nicelendirme enerji tasarrufları. Kavramdan bahsediyor ancak somut verilerden yoksun—tasarruf edilen joule yok, azaltılan karbon eşdeğeri yok, epoch başına enerji kullanım karşılaştırması yok. Bu büyük bir kaçırılmış fırsat. Bu nicelendirme olmadan, enerji argümanı kesin olmaktan ziyade niteliksel ve önerici kalıyor. Ayrıca, modelin aşırı piyasa olaylarına ("kara kuğular") karşı sağlamlığı ele alınmamış—gerçek dünya ticaret sistemleri için kritik bir boşluk.
Uygulanabilir Öngörüler: Quantlar ve AI ekipleri için: 1) Eğitiminizi Enstrümantasyonla Donatın: Kayıp metrikleriyle eş zamanlı olarak (NVIDIA-SMI gibi araçları kullanarak) GPU güç tüketimini izlemeye hemen başlayın. Bir "watt başına performans" kıyas noktası oluşturun. 2) Erken Durdurmanın Ötesine Geçin: TensorFlow Lite'da araştırıldığı gibi, model budama, nicemleme veya bilgi damıtma gibi daha gelişmiş verimlilik teknikleriyle denemeler yaparak, doğruluğu koruyan daha küçük, daha hızlı, daha az enerji tüketen modeller oluşturun. 3) Sağlamlık İçin Stres Testi: Modeli yalnızca normal dönemlerde değil, yüksek oynaklıklı kriz verileri üzerinde de doğrulayın. Piyasa çöküşü sırasında sessizce başarısız olan model, işe yaramaz olandan daha kötüdür. Gelecek, hem akıllı hem de verimli olan modellere aittir.
LSTM hücresinin çekirdeği, bir geçit mekanizması aracılığıyla kaybolan gradyan problemini ele alır. Tek bir zaman adımı (t) için temel denklemler şunlardır:
Unutma Kapısı: $f_t = \sigma(W_f \cdot [h_{t-1}, x_t] + b_f)$
Giriş Kapısı: $i_t = \sigma(W_i \cdot [h_{t-1}, x_t] + b_i)$
Aday Hücre Durumu: $\tilde{C}_t = \tanh(W_C \cdot [h_{t-1}, x_t] + b_C)$
Hücre Durumu Güncellemesi: $C_t = f_t * C_{t-1} + i_t * \tilde{C}_t$
Çıkış Kapısı: $o_t = \sigma(W_o \cdot [h_{t-1}, x_t] + b_o)$
Gizli Durum Çıktısı: $h_t = o_t * \tanh(C_t)$
Burada $\sigma$ sigmoid fonksiyonudur, $*$ eleman bazında çarpımı ifade eder, $W$ ve $b$ ağırlıklar ve önyargılardır, $h$ gizli durumdur ve $x$ girdidir.
Modelin eğitim sırasındaki kayıp fonksiyonu, tipik olarak daha önce tanımlandığı gibi Ortalama Kare Hata'dır (MSE) ve optimize edici (örneğin, Adam) ağırlıkları (W, b) ayarlayarak bunu en aza indirir.
Senaryo: Nicel bir hedge fon, EUR/USD için düşük gecikmeli, enerji bilincine sahip bir ticaret sinyali geliştirmek istiyor.
Çerçeve Uygulaması: