1. Pengenalan

Ramalan tepat kadar pertukaran RMB/USD adalah satu cabaran kritikal dalam kewangan antarabangsa, yang memberi kesan kepada perdagangan, pelaburan, dan dasar monetari. Volatiliti semula jadi dan dinamik tidak linear yang kompleks dalam pasaran forex menyebabkan model ekonometrik tradisional tidak mencukupi. Penyelidikan ini menangani jurang ini dengan menilai secara sistematik model pembelajaran mendalam (DL) termaju—termasuk Long Short-Term Memory (LSTM), Rangkaian Neural Konvolusi (CNN), dan seni bina berasaskan Transformer—untuk ramalan kadar pertukaran. Satu inovasi utama ialah integrasi teknik AI yang boleh diterangkan (XAI), khususnya Pemetaan Pengaktifan Kelas Berwajaran Kecerunan (Grad-CAM), untuk menerangkan keputusan model dan mengenal pasti ciri makroekonomi dan kewangan yang paling berpengaruh.

2. Metodologi & Model

2.1 Data & Kejuruteraan Ciri

Kajian ini menggunakan set data komprehensif 40 ciri merentasi 6 kategori untuk meramal kadar RMB/USD. Kategori ciri termasuk:

  • Penunjuk Makroekonomi: Pertumbuhan KDNK, kadar inflasi (CPI, PPI), perbezaan kadar faedah.
  • Aliran Perdagangan & Modal: Jumlah perdagangan dua hala antara China dan A.S., imbangan akaun semasa.
  • Kadar Pertukaran Berkaitan: Pasangan mata wang silang seperti EUR/RMB dan USD/JPY.
  • Sentimen Pasaran & Volatiliti: Indeks volatiliti tersirat, harga komoditi (cth., minyak).
  • Dasar Monetari: Kadar dasar bank pusat dan keperluan rizab.
  • Penunjuk Teknikal: Purata bergerak, pengayun momentum yang diperoleh daripada data harga sejarah.

Proses pemilihan ciri yang ketat digunakan untuk mengurangkan dimensi dan menyerlahkan pembolehubah paling ramalan, menekankan pemacu ekonomi asas berbanding hingar.

2.2 Seni Bina Pembelajaran Mendalam

Penyelidikan ini membandingkan beberapa model termaju:

  • LSTM: Menangkap kebergantungan temporal jangka panjang dalam data berjujukan.
  • CNN: Mengekstrak corak dan ciri tempatan merentasi data siri masa.
  • Transformer: Menggunakan mekanisme perhatian kendiri untuk menimbang kepentingan langkah masa dan ciri yang berbeza secara global.
  • TSMixer: Model berasaskan MLP yang direka untuk ramalan siri masa, yang mengatasi yang lain dalam kajian ini. Ia menggunakan lapisan padat merentasi dimensi masa dan ciri, menawarkan seni bina yang lebih mudah tetapi sangat berkesan untuk menangkap interaksi kompleks.

2.3 Kebolehterangan dengan Grad-CAM

Untuk melangkaui pendekatan "kotak hitam", pengarang menggunakan Grad-CAM, teknik yang asalnya dibangunkan untuk penglihatan komputer (Selvaraju et al., 2017), kepada ramalan siri masa. Grad-CAM menghasilkan peta haba yang menyerlahkan ciri input mana (dan pada langkah masa mana) yang paling kritikal untuk ramalan model. Ini membolehkan penganalisis mengesahkan sama ada fokus model selari dengan intuisi ekonomi—contohnya, mengutamakan data jumlah perdagangan semasa tempoh ketegangan perdagangan yang meningkat.

3. Keputusan Eksperimen

3.1 Metrik Prestasi

Model dinilai menggunakan metrik piawai: Ralat Mutlak Purata (MAE), Ralat Punca Kuasa Dua Purata (RMSE), dan Ralat Peratusan Mutlak Purata (MAPE).

Ringkasan Prestasi Model (Data Hipotesis)

Prestasi Terbaik (TSMixer): RMSE = 0.0052, MAPE = 0.68%

Transformer: RMSE = 0.0058, MAPE = 0.75%

LSTM: RMSE = 0.0061, MAPE = 0.80%

CNN: RMSE = 0.0065, MAPE = 0.85%

Nota: Keputusan berangka spesifik adalah ilustrasi berdasarkan naratif kertas tentang keunggulan TSMixer.

3.2 Penemuan Utama & Visualisasi

Model TSMixer secara konsisten memberikan ramalan yang paling tepat. Lebih penting, visualisasi Grad-CAM mendedahkan pandangan boleh tindak:

  • Kepentingan Ciri: Model memberikan pemberat tinggi kepada jumlah perdagangan China-A.S. dan kadar pertukaran EUR/RMB, mengesahkan kepentingan hubungan perdagangan asas dan arbitraj mata wang silang.
  • Fokus Temporal: Semasa fasa pasaran tidak stabil (cth., pasca reformasi 2015, geseran perdagangan 2018), perhatian model beralih tajam kepada penunjuk sentimen berasaskan berita dan tarikh pengumuman dasar.
  • Penerangan Carta: Peta haba Grad-CAM hipotesis akan menunjukkan visualisasi berbilang baris. Setiap baris mewakili satu ciri (cth., Trade_Volume, EUR_RMB). Paksi-x ialah masa. Sel diwarnakan dari biru (kepentingan rendah) ke merah (kepentingan tinggi). Tempoh utama menunjukkan jalur merah terang merentasi ciri asas, secara visual "menerangkan" ramalan tersebut.

4. Analisis & Perbincangan

4.1 Teras Pandangan & Aliran Logik

Teras Pandangan: Sumbangan paling berharga kertas ini bukan sekadar pembelajaran mendalam berfungsi, tetapi bahawa seni bina yang lebih mudah dan direka dengan baik (TSMixer) boleh mengatasi yang lebih kompleks (Transformer) untuk tugas ramalan kewangan tertentu, terutamanya apabila digandingkan dengan kejuruteraan ciri ketat dan alat kebolehterangan. Aliran logik adalah kukuh: kenal pasti kerumitan masalah ramalan, uji satu set model DL moden, dan kemudian gunakan XAI untuk mengesahkan dan mentafsir logik pemenang. Ini mengalihkan bidang dari prestasi ramalan tulen kepada prestasi boleh diaudit.

4.2 Kekuatan & Kelemahan Kritikal

Kekuatan:

  • Integrasi XAI Praktikal: Menggunakan Grad-CAM pada siri masa kewangan adalah langkah bijak dan pragmatik ke arah kebolehpercayaan model, satu halangan utama dalam penerimaan industri.
  • Pendekatan Berpusatkan Ciri: Penekanan pada ciri ekonomi asas (perdagangan, kadar silang) berbanding analisis teknikal tulen membumikan model dalam realiti ekonomi.
  • Penanda Aras Kuat: Membandingkan LSTM, CNN, dan Transformer menyediakan penanda aras kontemporari yang berguna untuk bidang ini.
Kelemahan & Ketinggalan Kritikal:
  • Risiko Overfitting Dipermudahkan: Dengan 40 ciri dan model kompleks, kertas ini berkemungkinan menghadapi risiko overfitting yang ketara. Butiran mengenai pengekalan (dropout, susutan berat) dan tempoh ujian luar sampel yang teguh (cth., melalui volatiliti COVID-19) adalah penting dan kurang dilaporkan.
  • Bias Snooping Data: Proses pemilihan ciri, walaupun ketat, secara semula jadi memperkenalkan bias pandangan ke hadapan jika tidak diurus dengan teliti menggunakan tetingkap bergulir. Ini adalah tumit Achilles bagi banyak kertas kewangan ML.
  • Kekurangan Ujian Kejutan Ekonomi: Bagaimana prestasi TSMixer semasa peristiwa angsa hitam sebenar? Prestasinya semasa reformasi 2015 dicatat, tetapi ujian tekanan terhadap kemalangan pasaran 2020 atau pivot Fed 2022 akan lebih bermaklumat.
  • Perbandingan dengan Penanda Aras Lebih Mudah: Adakah ia mengatasi dengan ketara model ARIMA mudah atau jalan rawak? Kadangkala, kerumitan menambah keuntungan marginal pada kos tinggi.

4.3 Pandangan Boleh Tindak

Untuk kuant dan institusi kewangan:

  1. Utamakan TSMixer untuk Projek Perintis: Keseimbangan prestasi dan kesederhanaannya menjadikannya titik permulaan berisiko rendah, ganjaran tinggi untuk sistem ramalan forex dalaman.
  2. Wajibkan XAI untuk Pengesahan Model: Tegaskan alat seperti Grad-CAM bukan sebagai pemikiran lepas, tetapi sebagai sebahagian teras kitaran hayat pembangunan model. "Penaakulan" model mesti boleh diaudit sebelum penyebaran.
  3. Fokus pada Pustaka Ciri, Bukan Hanya Model: Labur dalam membina dan mengekalkan set data berkualiti tinggi, kependaman rendah untuk 6 kategori ciri yang dikenal pasti. Model hanya sebaik bahan bakarnya.
  4. Laksanakan Pengesahan Silang Temporal yang Ketat: Untuk melawan snooping data, gunakan protokol ujian belakang asal bergulir yang ketat seperti yang diterangkan dalam kajian dari Federal Reserve Bank (cth., kerja mereka pada nowcasting).
Kertas ini adalah pelan, bukan penyelesaian pasang-dan-guna. Nilai sebenarnya adalah dalam menunjukkan metodologi yang maju dan boleh dipertanggungjawabkan.

5. Selaman Teknikal Mendalam

5.1 Formulasi Matematik

Masalah ramalan teras dirumuskan sebagai meramalkan pulangan kadar pertukaran tempoh seterusnya $y_{t+1}$ diberi siri masa multivariat ciri $\mathbf{X}_t = \{x^1_t, x^2_t, ..., x^F_t\}$ merentasi tetingkap pandangan ke belakang $L$ tempoh: $\{\mathbf{X}_{t-L}, ..., \mathbf{X}_t\}$.

Lapisan TSMixer (Dipermudahkan): Satu operasi utama dalam TSMixer melibatkan dua jenis percampuran MLP:

  • Percampuran Masa: $\mathbf{Z} = \sigma(\mathbf{W}_t \cdot \mathbf{X} + \mathbf{b}_t)$ menggunakan lapisan padat merentasi dimensi masa untuk setiap ciri secara bebas, menangkap corak temporal.
  • Percampuran Ciri: $\mathbf{Y} = \sigma(\mathbf{W}_f \cdot \mathbf{Z}^T + \mathbf{b}_f)$ menggunakan lapisan padat merentasi dimensi ciri pada setiap langkah masa, memodelkan interaksi antara penunjuk ekonomi yang berbeza.
di mana $\sigma$ ialah pengaktifan tidak linear (cth., GELU), $\mathbf{W}$ ialah matriks berat, dan $\mathbf{b}$ ialah bias.

Grad-CAM untuk Siri Masa: Untuk ramalan sasaran $\hat{y}$, skor kepentingan $\alpha^c_k$ untuk ciri $k$ dikira oleh penyebaran balik kecerunan: $$\alpha^c_k = \frac{1}{T} \sum_{t} \frac{\partial \hat{y}^c}{\partial A^k_t}$$ di mana $A^k_t$ ialah pengaktifan lapisan konvolusi atau padat terakhir untuk ciri $k$ pada masa $t$. Peta haba Grad-CAM akhir $L^c_{Grad-CAM}$ ialah gabungan berwajaran pengaktifan ini: $L^c_{Grad-CAM} = ReLU(\sum_k \alpha^c_k A^k)$. ReLU memastikan hanya ciri dengan pengaruh positif ditunjukkan.

5.2 Contoh Kerangka Analisis

Kes: Menganalisis Fokus Model Semasa Pengumuman Dasar
Skenario: Fed mengumumkan kenaikan kadar mengejut. Model TSMixer anda meramalkan susut nilai RMB.

  1. Langkah 1 - Hasilkan Ramalan & Grad-CAM: Jalankan model untuk tempoh selepas pengumuman. Ekstrak peta haba Grad-CAM.
  2. Langkah 2 - Tafsir Peta Haba: Kenal pasti baris ciri mana (cth., `USD_Index`, `CN_US_Interest_Diff`) menunjukkan pengaktifan tinggi (merah) pada dan sejurus selepas langkah masa pengumuman.
  3. Langkah 3 - Sahkan dengan Intuisi: Adakah fokus model selari dengan teori? Fokus kuat pada perbezaan kadar faedah mengesahkan model. Jika ia fokus terutamanya pada, katakan, `Oil_Price`, ia akan menaikkan bendera merah memerlukan siasatan ke dalam korelasi palsu.
  4. Langkah 4 - Tindakan: Jika disahkan, pandangan ini mengukuhkan keyakinan dalam menggunakan model untuk analisis senario sekitar mesyuarat Fed masa depan. Peta haba menyediakan laporan visual langsung untuk pemegang kepentingan.
Kerangka ini mengubah soal siasat model dari latihan statistik kepada audit berstruktur dan intuitif.

6. Aplikasi & Hala Tuju Masa Depan

Metodologi yang diterokai di sini mempunyai kebolehgunaan luas di luar RMB/USD:

  • Ramalan Multi-Aset: Menggunakan TSMixer+Grad-CAM pada pasangan mata wang lain, volatiliti kripto, atau ramalan harga komoditi.
  • Analisis Kesan Dasar: Bank pusat boleh menggunakan model boleh diterangkan sedemikian untuk mensimulasikan kesan pasaran perubahan dasar berpotensi, memahami saluran mana (kadar faedah, panduan hadapan) pasaran paling sensitif.
  • Pengurusan Risiko Masa Nyata: Mengintegrasikan saluran paip ini ke dalam papan pemuka dagangan masa nyata, di mana Grad-CAM menyerlahkan peralihan dalam faktor pendorong apabila berita pecah, membolehkan pelarasan strategi lindung nilai dinamik.
  • Integrasi dengan Data Alternatif: Kerja masa depan mesti menggabungkan data tidak berstruktur (sentimen berita dari model NLP, nada ucapan bank pusat) sebagai ciri tambahan, menggunakan kerangka kebolehterangan yang sama untuk menimbang kesannya berbanding asas tradisional.
  • Penemuan Kausal: Sempadan seterusnya ialah beralih dari korelasi (diserlahkan oleh Grad-CAM) kepada kausaliti. Teknik seperti algoritma penemuan kausal (cth., PCMCI) boleh digabungkan dengan model DL untuk membezakan pemacu asas dari corak kebetulan.

7. Rujukan

  1. Meng, S., Chen, A., Wang, C., Zheng, M., Wu, F., Chen, X., Ni, H., & Li, P. (2023). Enhancing Exchange Rate Forecasting with Explainable Deep Learning Models. Manuskrip dalam penyediaan.
  2. Selvaraju, R. R., Cogswell, M., Das, A., Vedantam, R., Parikh, D., & Batra, D. (2017). Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization. Proceedings of the IEEE International Conference on Computer Vision (ICCV), 618-626.
  3. Chen, S., & Hardle, W. K. (2023). AI in Finance: Challenges, Advances, and Opportunities. Annual Review of Financial Economics, 15.
  4. Federal Reserve Bank of New York. (2022). Nowcasting with Large Datasets. Laporan Kakitangan. Diperoleh dari https://www.newyorkfed.org/research/staff_reports
  5. Diebold, F. X., & Yilmaz, K. (2015). Financial and Macroeconomic Connectedness: A Network Approach to Measurement and Monitoring. Oxford University Press.