3.1. Pra-pemprosesan Data
Data Forex mentalah dibersihkan, dinormalkan, dan distrukturkan kepada langkah masa berjujukan yang sesuai untuk input LSTM. Kejuruteraan ciri mungkin merangkumi penunjuk teknikal (contohnya, purata bergerak, RSI).
Pasaran Pertukaran Asing (Forex), dengan volum dagangan harian melebihi $5 trilion, mewakili pasaran kewangan terbesar dan paling cair di peringkat global. Ramalan tepat kadar pertukaran mata wang, terutamanya untuk pasangan utama seperti EUR/USD, adalah penting untuk pengurusan risiko dan memaksimumkan pulangan. Kajian ini menyiasat aplikasi rangkaian neural Long Short-Term Memory (LSTM) untuk tugas ini, dengan fokus dwi: mengoptimumkan ketepatan ramalan dan menilai implikasi model terhadap penggunaan tenaga pengiraan. Penyelidikan ini bertujuan untuk menjembatani ramalan kewangan dengan amalan pengkomputeran lestari.
Ramalan Forex telah berkembang daripada analisis teknikal dan asas tradisional kepada teknik pembelajaran mesin yang canggih. Model awal bergantung pada kaedah siri masa statistik (contohnya, ARIMA). Kemunculan Rangkaian Neural Buatan (ANN) dan Mesin Vektor Sokongan (SVM) menandakan peralihan penting. Kebelakangan ini, model pembelajaran mendalam, terutamanya LSTM dan hibridnya (contohnya, LSTM-RCN), telah mendapat tempat utama kerana keupayaannya menangkap kebergantungan temporal jangka panjang dalam data kewangan yang tidak menentu—satu kelebihan kritikal berbanding model yang lebih ringkas.
Kajian ini menggunakan pendekatan pembelajaran berpandu menggunakan data kadar pertukaran EUR/USD sejarah.
Data Forex mentalah dibersihkan, dinormalkan, dan distrukturkan kepada langkah masa berjujukan yang sesuai untuk input LSTM. Kejuruteraan ciri mungkin merangkumi penunjuk teknikal (contohnya, purata bergerak, RSI).
Satu seni bina LSTM berbilang lapisan direka bentuk. Model ini merangkumi lapisan LSTM untuk pemprosesan jujukan, diikuti oleh lapisan Dense untuk ramalan output. Hiperparameter seperti bilangan lapisan, unit, dan kadar dropout ditala.
Prestasi model dinilai dengan ketat menggunakan tiga metrik utama:
Model LSTM yang dioptimumkan, dilatih selama 90 epoch, menunjukkan prestasi unggul berbanding model asas (contohnya, RNN ringkas, ARIMA). Keputusan utama termasuk:
Kajian ini mengetengahkan aspek kritikal yang sering diabaikan: kos pengiraan pembelajaran mendalam. Melatih model LSTM kompleks memerlukan sumber GPU/CPU yang ketara, membawa kepada penggunaan tenaga yang tinggi. Kertas kerja ini berhujah bahawa pengoptimuman model (contohnya, seni bina cekap, hentian awal pada 90 epoch) bukan sahaja meningkatkan ketepatan tetapi juga mengurangkan beban pengiraan, seterusnya menurunkan jejak tenaga berkaitan dan menyumbang kepada kelestarian alam sekitar dalam dagangan algoritma.
Inti Pati: Nilai sebenar kertas kerja ini bukan sekadar satu lagi keputusan "LSTM mengatasi asas dalam kewangan". Inti pati utamanya ialah membingkaikan pengoptimuman model sebagai masalah dwi-objektif: memaksimumkan kuasa ramalan sambil meminimumkan perbelanjaan tenaga pengiraan. Dalam era di mana jejak karbon AI sedang dikaji (seperti yang diketengahkan dalam kajian seperti dari inisiatif ML CO2 Impact), ini mengalihkan tiang gol daripada sekadar ketepatan kepada ketepatan cekap.
Aliran Logik: Hujah berkembang secara logik: 1) Ramalan Forex bernilai tetapi intensif pengiraan. 2) LSTM adalah terkini untuk ramalan jujukan. 3) Kita boleh mengoptimumkannya (seni bina, epoch). 4) Pengoptimuman meningkatkan metrik (MSE, MAE, R²). 5) Yang penting, pengoptimuman yang sama mengurangkan pengiraan berlebihan, menjimatkan tenaga. 6) Ini selari dengan prinsip Green AI yang lebih luas. Hubungan antara kecekapan model dan kecekapan tenaga dibuat dengan meyakinkan.
Kekuatan & Kelemahan: Kekuatan: Sudut interdisiplin adalah bijak dan perlu. Ia menghubungkan teknologi kewangan dengan pengkomputeran lestari. Penggunaan metrik piawai (MSE, MAE, R²) membuatkan tuntutan prestasi boleh disahkan. Kelemahan Signifikan: Kertas kerja ini ketara kurang dalam mengkuantifikasi penjimatan tenaga. Ia menyebut konsep tetapi kekurangan data keras—tiada joule yang dijimatkan, tiada setara karbon dikurangkan, tiada perbandingan penggunaan tenaga per epoch. Ini adalah peluang terlepas yang besar. Tanpa kuantifikasi ini, hujah tenaga kekal kualitatif dan bersifat cadangan bukannya konklusif. Tambahan pula, ketahanan model terhadap peristiwa pasaran ekstrem ("black swans") tidak ditangani—satu jurang kritikal untuk sistem dagangan dunia sebenar.
Pandangan Boleh Tindak: Untuk pasukan kuant dan AI: 1) Alatkan Latihan Anda: Segera mula menjejak penggunaan kuasa GPU (menggunakan alat seperti NVIDIA-SMI) bersama-sama metrik kerugian. Wujudkan penanda aras "prestasi per watt". 2) Melangkaui Hentian Awal: Bereksperimen dengan teknik kecekapan lanjutan seperti pemangkasan model, kuantisasi (seperti yang diterokai dalam TensorFlow Lite), atau penyulingan pengetahuan untuk mencipta model yang lebih kecil, pantas, kurang lapar tenaga yang mengekalkan ketepatan. 3) Ujian Tekanan untuk Ketahanan: Sahkan model bukan sahaja pada tempoh normal tetapi pada data krisis turun naik tinggi. Model yang gagal senyap semasa kejatuhan pasaran adalah lebih teruk daripada tidak berguna. Masa depan milik model yang bijak dan cekap.
Teras sel LSTM menangani masalah kecerunan lenyap melalui mekanisme pintu. Persamaan utama untuk satu langkah masa (t) ialah:
Pintu Lupa: $f_t = \sigma(W_f \cdot [h_{t-1}, x_t] + b_f)$
Pintu Input: $i_t = \sigma(W_i \cdot [h_{t-1}, x_t] + b_i)$
Keadaan Sel Calon: $\tilde{C}_t = \tanh(W_C \cdot [h_{t-1}, x_t] + b_C)$
Kemas Kini Keadaan Sel: $C_t = f_t * C_{t-1} + i_t * \tilde{C}_t$
Pintu Output: $o_t = \sigma(W_o \cdot [h_{t-1}, x_t] + b_o)$
Output Keadaan Tersembunyi: $h_t = o_t * \tanh(C_t)$
Di mana $\sigma$ ialah fungsi sigmoid, $*$ menandakan pendaraban unsur demi unsur, $W$ dan $b$ ialah pemberat dan bias, $h$ ialah keadaan tersembunyi, dan $x$ ialah input.
Fungsi kerugian model semasa latihan biasanya Min Ralat Kuasa Dua (MSE), seperti yang ditakrifkan sebelum ini, yang diminimumkan oleh pengoptimum (contohnya, Adam) dengan melaraskan pemberat (W, b).
Skenario: Sebuah dana lindung nilai kuantitatif ingin membangunkan isyarat dagangan berlatensi rendah dan sedar tenaga untuk EUR/USD.
Aplikasi Kerangka: