Kandungan
1. Pengenalan
Penyelidikan ini menangani cabaran kritikal meramal kadar pertukaran Dolar AS kepada Taka Bangladesh (USD/BDT), satu tugas penting untuk ekonomi Bangladesh yang bergantung kepada import. Turun naik mata wang memberi kesan langsung kepada pengurusan rizab asing, imbangan dagangan, dan inflasi. Model statistik tradisional sering gagal menangkap corak tidak linear dan kompleks yang menjadi ciri mata wang pasaran baru muncul, terutamanya semasa ketidakpastian ekonomi. Kajian ini memanfaatkan pembelajaran mesin termaju, khususnya rangkaian neural Long Short-Term Memory (LSTM), untuk memodelkan hubungan temporal dinamik ini menggunakan data sejarah dari 2018 hingga 2023.
2. Sorotan Literatur
Literatur terkini menetapkan keunggulan rangkaian LSTM berbanding model siri masa tradisional seperti ARIMA untuk ramalan kewangan. Dipelopori oleh Hochreiter & Schmidhuber untuk menyelesaikan masalah kecerunan lenyap dalam RNN, LSTM cemerlang dalam menangkap kebergantungan jangka panjang. Penambahbaikan seterusnya seperti pintu lupa (Gers et al.) meningkatkan kebolehsesuaian kepada turun naik. Kajian empirikal ke atas pasangan mata wang utama menunjukkan LSTM mengatasi ARIMA sebanyak 18–22% dalam ketepatan arah. Walaupun penyelidikan ke atas mata wang seperti USD/INR wujud, kajian khusus ke atas USD/BDT adalah terhadap, sering menggunakan data pra-pandemik dan kekurangan integrasi teknik moden seperti mekanisme perhatian atau kejutan makroekonomi tempatan.
3. Metodologi & Data
3.1. Pengumpulan & Pra-pemprosesan Data
Data kadar pertukaran harian sejarah USD/BDT diperoleh daripada Yahoo Finance untuk tempoh 2018–2023. Data menunjukkan penurunan kadar BDT/USD dari kira-kira 0.012 kepada 0.009. Pra-pemprosesan data melibatkan pengendalian nilai hilang, pengiraan pulangan harian ternormal untuk menangkap turun naik, dan penciptaan jujukan untuk model siri masa.
3.2. Seni Bina Model LSTM
Model ramalan teras adalah rangkaian neural LSTM. Seni binanya dioptimumkan untuk set data USD/BDT, kemungkinan melibatkan berbilang lapisan LSTM, dropout untuk pengawalseliaan, dan lapisan keluaran padat. Model ini dilatih untuk meramal nilai kadar pertukaran masa depan berdasarkan jujukan lepas.
3.3. Pengelas Peningkatan Kecerunan (GBC)
Pengelas Peningkatan Kecerunan digunakan untuk ramalan arah—meramalkan sama ada kadar pertukaran akan bergerak naik atau turun. Prestasi model ini dinilai melalui simulasi dagangan praktikal.
4. Keputusan Eksperimen & Analisis
Ketepatan LSTM
99.449%
RMSE LSTM
0.9858
RMSE ARIMA
1.342
Dagangan Menguntungkan GBC
40.82%
4.1. Metrik Prestasi LSTM
Model LSTM mencapai keputusan luar biasa: ketepatan 99.449%, Ralat Punca Min Kuasa Dua (RMSE) 0.9858, dan kehilangan ujian 0.8523. Ini menunjukkan model yang sangat tepat untuk meramal nilai sebenar kadar USD/BDT.
4.2. Simulasi Dagangan GBC
Ujian balik dijalankan menggunakan isyarat arah GBC ke atas modal permulaan $10,000 merentasi 49 dagangan. Walaupun 40.82% dagangan menguntungkan, strategi ini mengakibatkan kerugian bersih $20,653.25. Ini menyerlahkan perbezaan kritikal antara ketepatan ramalan dan dagangan yang menguntungkan, di mana kos transaksi, slipaj, dan pengurusan risiko adalah utama.
4.3. Analisis Perbandingan vs. ARIMA
Model LSTM mengatasi model ARIMA tradisional dengan ketara, yang mempunyai RMSE 1.342. Ini menunjukkan kelebihan jelas pembelajaran mendalam dalam memodelkan corak kompleks dan tidak linear yang wujud dalam data siri masa kewangan.
5. Butiran Teknikal & Kerangka Matematik
Sel LSTM beroperasi melalui mekanisme pintu yang mengawal aliran maklumat. Persamaan utama adalah:
- Pintu Lupa: $f_t = \sigma(W_f \cdot [h_{t-1}, x_t] + b_f)$
- Pintu Input: $i_t = \sigma(W_i \cdot [h_{t-1}, x_t] + b_i)$, $\tilde{C}_t = \tanh(W_C \cdot [h_{t-1}, x_t] + b_C)$
- Kemas Kini Keadaan Sel: $C_t = f_t * C_{t-1} + i_t * \tilde{C}_t$
- Pintu Output: $o_t = \sigma(W_o \cdot [h_{t-1}, x_t] + b_o)$, $h_t = o_t * \tanh(C_t)$
Di mana $\sigma$ ialah fungsi sigmoid, $*$ menandakan pendaraban unsur demi unsur, $W$ ialah matriks pemberat, $b$ ialah vektor pincang, $x_t$ ialah input, $h_t$ ialah keadaan tersembunyi, dan $C_t$ ialah keadaan sel. Struktur ini membolehkan rangkaian belajar maklumat mana yang perlu dikekalkan atau dibuang merentasi jujukan panjang.
6. Kerangka Analisis: Contoh Praktikal
Kes: Mengintegrasikan Kejutan Makroekonomi ke dalam Saluran Paip LSTM
Kajian menyebut tentang menggabungkan pengesanan kejutan makroekonomi tempatan. Berikut adalah kerangka konseptual untuk bagaimana ini boleh dilaksanakan tanpa kod eksplisit:
- Penambahan Data: Cipta set data siri masa selari "penunjuk kejutan" untuk Bangladesh. Ini boleh menjadi penanda binari (0/1) untuk peristiwa seperti pengumuman campur tangan bank pusat, peristiwa politik utama, atau perubahan dalam aliran kiriman wang, diperoleh daripada API berita atau buletin rasmi.
- Kejuruteraan Ciri: Untuk setiap hari dagangan, cantumkan tetingkap sejarah data kadar pertukaran dengan tetingkap penunjuk kejutan yang sepadan. Ini mencipta vektor input yang diperkaya:
[Price_Seq, Shock_Seq]. - Penyesuaian Model: Laraskan lapisan input LSTM untuk menerima input pelbagai dimensi ini. Rangkaian akan belajar mengaitkan corak kejutan tertentu dengan turun naik atau perubahan tren seterusnya dalam kadar USD/BDT.
- Pengesahan: Bandingkan prestasi (RMSE, ketepatan arah) model yang diperkaya kejutan dengan model asas yang hanya menggunakan data harga, khususnya semasa tempoh yang ditandai oleh kejutan.
7. Aplikasi Masa Depan & Hala Tuju Penyelidikan
- Integrasi Data Pelbagai Modal: Selain penanda makroekonomi, mengintegrasikan analisis sentimen masa nyata daripada berita kewangan dan media sosial (contohnya, menggunakan model Transformer seperti BERT) boleh menangkap mood pasaran, seperti yang dilihat dalam kajian ke atas pasangan forex utama.
- Mekanisme Perhatian: Menggabungkan lapisan perhatian (seperti dalam seni bina Transformer) ke dalam LSTM boleh membolehkan model memberi tumpuan secara dinamik kepada langkah masa lepas yang paling relevan, meningkatkan kebolehinterpretasian dan prestasi untuk jujukan panjang.
- Pelajaran Pengukuhan untuk Dagangan: Bergerak dari ramalan tulen kepada pembelajaran polisi langsung. Model seperti Deep Q-Network (DQN) boleh dilatih untuk membuat keputusan beli/jual/tahan yang memaksimumkan pulangan terlaras risiko (Nisbah Sharpe), menangani secara langsung jurang keuntungan yang dilihat dalam ujian balik GBC.
- Pelajaran Rentas Mata Wang: Membangunkan meta-model yang dilatih pada berbilang pasangan mata wang pasaran baru muncul (contohnya, USD/INR, USD/PKR) untuk belajar corak universal turun naik dan kesan polisi, kemudian halus-tala pada USD/BDT untuk keteguhan yang lebih baik dengan data terhadap.
8. Rujukan
- Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. Neural Computation.
- Gers, F. A., Schmidhuber, J., & Cummins, F. (2000). Learning to Forget: Continual Prediction with LSTM. Neural Computation.
- Rahman et al. (Year). Study on USD/INR forecasting with LSTM. [Relevant Journal].
- Afrin et al. (2021). Pre-pandemic study on USD/BDT. [Relevant Conference].
- Hosain et al. (Year). Hybrid techniques for currency forecasting. [Relevant Journal].
- Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems.
- Mnih, V., et al. (2015). Human-level control through deep reinforcement learning. Nature.
9. Analisis Asal & Ulasan Pakar
Inti Pati: Kertas kerja ini berjaya menunjukkan keunggulan teknikal rangkaian LSTM berbanding model warisan seperti ARIMA untuk ramalan titik tetapi secara tidak sengaja mendedahkan jurang berbahaya dalam penyelidikan fintech: percampuran ketepatan statistik dengan utiliti ekonomi. Model tepat 99.45% yang, apabila diterjemahkan ke dalam strategi dagangan melalui Pengelas Peningkatan Kecerunan, menanggung kerugian bencana 200%+ ke atas modal permulaan bukan sekadar nota kaki akademik—ia adalah panggilan kuat untuk peralihan asas dalam cara kita menilai AI dalam kewangan.
Aliran Logik & Kekuatan: Logik penyelidikan adalah kukuh dan boleh direplikasi. Penulis mengenal pasti dengan betul batasan model linear untuk mata wang tidak linear dan sensitif polisi seperti BDT. Penggunaan mereka terhadap rejim terap terkawal sebagai kajian kes adalah bijak, kerana pasaran ini matang untuk gangguan AI. Pelaksanaan teknikal adalah teguh, dengan RMSE hampir sempurna LSTM 0.9858 (berbanding ARIMA 1.342) memberikan bukti tidak boleh disangkal tentang kapasiti pembelajaran mendalam untuk memodelkan kebergantungan temporal kompleks, penemuan yang konsisten dengan karya penting seperti kertas LSTM asal oleh Hochreiter & Schmidhuber. Percubaan untuk merentasi kepada hasil dagangan melalui GBC adalah langkah terpuji ke arah relevan dunia sebenar.
Kelemahan Kritikal & Paradoks Keuntungan: Di sinilah terletaknya kelemahan kritikal. Kadar kemenangan GBC 40.82% yang mengakibatkan kerugian besar adalah kes klasik mengabaikan asimetri pulangan kewangan. Ia menyerlahkan kekurangan metrik risiko bersepadu (contohnya, Nisbah Sharpe, Penarikan Maksimum) dan model pelaksanaan naif. Ini mencerminkan perangkap biasa dalam kertas AI kewangan awal yang tertumpu semata-mata pada ralat ramalan. Bidang ini telah berkembang sejak itu, seperti yang dilihat dalam pendekatan pembelajaran pengukuhan yang mengoptimumkan secara langsung untuk pulangan portfolio, seperti kerangka Deep Q-Network (DQN) yang digunakan dalam karya penting Mnih et al. Tambahan pula, walaupun kertas menyebut faktor makroekonomi, pelaksanaannya kelihatan sambil lewa. Untuk mata wang seperti BDT, yang sangat dipengaruhi oleh campur tangan bank pusat dan aliran kiriman wang, kegagalan untuk mengintegrasikan ini secara mendalam sebagai ciri berstruktur—mungkin menggunakan mekanisme perhatian untuk menimbang kesannya, seperti yang dicadangkan dalam seni bina Transformer—adalah peluang yang terlepas.
Wawasan Boleh Tindak & Jalan ke Hadapan: Untuk pengamal dan penyelidik, kajian ini menawarkan dua wawasan boleh tindak yang penting. Pertama, berhenti menyembah di altar RMSE. Metrik penilaian utama untuk sebarang model yang menghadap pasaran mestilah prestasinya dalam persekitaran dagangan simulasi yang termasuk kos realistik, slipaj, dan saiz kedudukan. Alat seperti Backtrader atau QuantConnect tidak boleh dirunding dalam saluran paip pengesahan. Kedua, masa depan terletak pada pembelajaran hujung-ke-ejen. Daripada saluran paip terpisah (LSTM -> GBC -> Dagangan), sempadan seterusnya adalah menggunakan ejen tunggal dan holistik—kemungkinan berdasarkan Proximal Policy Optimization (PPO) atau algoritma RL termaju serupa—yang menelan data pasaran mentah atau diproses ringan dan secara langsung mengeluarkan tindakan dagangan terurus risiko. Fungsi ganjaran ejen ini akan menjadi komposit metrik pulangan terlaras risiko, memaksa AI belajar ekonomi sebenar pasaran, bukan sekadar corak statistiknya. Cadangan penulis untuk menambah analisis sentimen adalah permulaan yang baik, tetapi ia mesti digabungkan ke dalam seni bina berasaskan ejen ini, bukan sekadar ditambah sebagai lajur ciri lain. Inilah jalan dari mencipta peramal pintar ke kejuruteraan ejen kewangan yang boleh dilaksanakan.