1. Pengenalan
Pasaran pertukaran asing (Forex) adalah pasaran kewangan terbesar di dunia, dicirikan oleh kecairan tinggi, turun naik, dan kerumitan. Meramalkan pergerakan harga Forex terkenal sukar disebabkan pengaruh pelbagai faktor makroekonomi, peristiwa geopolitik, dan sentimen pasaran. Analisis teknikal tradisional, walaupun berguna, sering gagal menyesuaikan diri dengan perubahan pasaran secara tiba-tiba atau peristiwa "angsa hitam". Kertas kerja ini mencadangkan pendekatan pembelajaran mesin novel yang menggabungkan teknik pengelompokan dengan mekanisme perhatian untuk meningkatkan ketepatan ramalan, khususnya mensasarkan keadaan pasaran terlebih jual untuk strategi dagangan berasaskan peristiwa. Model ini menggunakan data Forex sejarah dan penunjuk teknikal terbitan dari 2005 hingga 2021.
2. Literatur Berkaitan
Penyelidikan ini dibina berdasarkan teori kewangan yang mantap dan aplikasi pembelajaran mesin dalam kewangan kuantitatif.
2.1 Penunjuk Teknikal
Penunjuk teknikal adalah pengiraan matematik berdasarkan harga sejarah, volum, atau minat terbuka yang digunakan untuk meramalkan arah pasaran kewangan. Model ini menggabungkan beberapa penunjuk utama.
2.1.1 Penunjuk Kekuatan Relatif (RSI)
RSI adalah pengayun momentum yang mengukur kelajuan dan perubahan pergerakan harga. Ia digunakan untuk mengenal pasti keadaan terlebih beli atau terlebih jual.
Formula: $RSI = 100 - \frac{100}{1 + RS}$ di mana $RS = \frac{\text{Purata Keuntungan sepanjang N tempoh}}{\text{Purata Kerugian sepanjang N tempoh}}$.
RSI di bawah 30 biasanya menunjukkan keadaan terlebih jual (peluang membeli berpotensi), manakala RSI melebihi 70 mencadangkan keadaan terlebih beli (peluang menjual berpotensi).
2.1.2 Purata Pergerakan Mudah (SMA), Purata Pergerakan Eksponen (EMA), MACD
SMA ialah min tidak berwajaran bagi N titik data sebelumnya. EMA memberi lebih berat kepada harga terkini. Moving Average Convergence Divergence (MACD) adalah penunjuk momentum yang mengikut trend.
Formula: $MACD = EMA(\text{12 tempoh}) - EMA(\text{26 tempoh})$.
Garis Isyarat (EMA 9-hari bagi MACD) digunakan untuk menjana isyarat dagangan. Persilangan antara MACD dan Garis Isyarat menunjukkan trend menaik atau menurun yang berpotensi.
2.1.3 Bollinger Bands
Bollinger Bands terdiri daripada garis SMA tengah dengan dua jalur luar yang diplot pada tahap sisihan piawai (biasanya 2). Ia mengukur turun naik pasaran. Mampatan (jalur mengecil) sering mendahului tempoh turun naik tinggi, manakala pergerakan harga di luar jalur mungkin menandakan kesinambungan atau pembalikan.
3. Teras Pandangan & Aliran Logik
Teras Pandangan: Pertaruhan asas kertas kerja ini adalah bahawa model siri masa harga/penunjuk tulen adalah rabun dekat. Dengan terlebih dahulu mengelompokkan rejim pasaran yang serupa (contohnya, terlebih jual turun naik tinggi, penyatuan turun naik rendah) dan kemudian menggunakan mekanisme perhatian dalam konteks tersebut, model dapat mengasingkan isyarat daripada hingar dengan lebih berkesan berbanding rangkaian LSTM atau GRU monolitik. Ini adalah satu bentuk pemodelan bersyarat—tingkah laku rangkaian secara eksplisit dikondisikan pada keadaan pasaran yang dikenal pasti.
Aliran Logik: Saluran paip ini berurutan dengan elegan: 1) Kejuruteraan Ciri: Data OHLC mentah ditransformasikan kepada set penunjuk teknikal yang kaya (RSI, MACD, kedudukan Bollinger Band). 2) Pengelompokan Rejim: Algoritma pengelompokan (mungkin K-Means atau Gaussian Mixture Model) membahagikan tempoh sejarah kepada keadaan berbeza berdasarkan profil penunjuk. 3) Ramalan Sedar Konteks: Untuk titik data tertentu, model terlebih dahulu mengenal pasti kelompoknya. Kemudian, model siri berasaskan perhatian (seperti pengekod Transformer) memproses sejarah terkini, dengan pemberat perhatiannya berpotensi dimodulasi oleh identiti kelompok, untuk meramalkan kebarangkalian pembalikan min yang menguntungkan dari keadaan terlebih jual.
4. Kekuatan & Kelemahan
Kekuatan:
- Kebaharuan Seni Bina: Langkah pra-pemprosesan pengelompokan adalah cara pragmatik untuk memperkenalkan pengendalian ketidakpegunan, masalah klasik dalam kewangan kuantitatif. Ia lebih boleh ditafsirkan daripada mengharapkan rangkaian dalam mempelajari rejim secara tersirat.
- Fokus pada Senario Boleh Tindak: Mensasarkan keadaan "terlebih jual" adalah kekangan yang bijak. Ia mengubah masalah ramalan terbuka kepada klasifikasi binari yang lebih mudah diurus: "Adakah isyarat terlebih jual semasa ini peluang membeli sebenar atau perangkap?"
- Asas pada Penunjuk Mantap: Menggunakan penunjuk teknikal terkenal sebagai ciri menjadikan input model difahami oleh pedagang tradisional, memudahkan penerimaan berpotensi.
Kelemahan & Jurang Kritikal:
- Bahaya Bias Snooping Data: Set data 2005-2021 merangkumi pelbagai krisis (2008, COVID-19). Tanpa analisis walk-forward yang ketat atau ujian luar sampel pada rejim pasaran yang benar-benar tidak dilihat (contohnya, 2022-2024 dengan perang dan inflasi), risiko terlalu sesuaian adalah teruk.
- Perhatian Kotak Hitam: Walaupun lapisan perhatian berkuasa, menerangkan mengapa model memberi perhatian kepada tempoh lalu tertentu masih mencabar. Dalam kewangan yang dikawal selia, "kebolehterangan" bukan sekadar baik untuk dimiliki.
- Perbincangan Sumber Alpha yang Hilang: Kertas kerja ini senyap tentang kos transaksi, slipaj, dan pengurusan risiko. Strategi yang kelihatan hebat dalam ujian balik boleh dihapuskan oleh geseran dunia sebenar. Adakah kelebihan yang diramalkan kekal selepas kos?
5. Pandangan Boleh Tindak
Untuk dana kuantitatif dan pedagang algoritma:
- Gandakan Pendekatan Pengelompokan Rejim: Sebelum membina model ramalan dalam seterusnya, segmenkan data sejarah anda kepada rejim. Langkah mudah ini boleh meningkatkan kestabilan model secara mendadak. Gunakan metrik seperti turun naik, kekuatan trend, dan korelasi untuk ciri pengelompokan.
- Ujian Tekanan pada "Pergeseran Rejim": Jangan hanya uji pada pembahagian masa rawak. Sengaja uji prestasi model anda semasa pergeseran rejim yang diketahui (contohnya, peralihan kepada krisis 2008 atau kemalangan COVID 2020). Ini adalah ujian litmus sebenar.
- Hibrid dengan Data Asas: Evolusi seterusnya adalah memberi makan algoritma pengelompokan bukan sahaja penunjuk teknikal tetapi juga coretan data makro (sentimen bank pusat dari berita, data keluk hasil). Ini boleh mencipta definisi rejim yang lebih teguh.
- Tuntut Kebolehterangan: Laksanakan alat seperti SHAP atau LIME untuk mentafsir pemberat perhatian. Hari lalu yang mana model anggap penting untuk ramalannya? Jejak audit ini penting untuk kedua-dua pengesahan dan pematuhan peraturan.
6. Analisis Asal
Model yang dicadangkan mewakili percubaan canggih untuk menangani masalah ketidakpegunan yang wujud dalam siri masa kewangan—cabaran yang diketengahkan dalam karya penting seperti "Advances in Financial Machine Learning" oleh Marcos López de Prado. Dengan menggunakan pengelompokan sebagai langkah pra-pemprosesan untuk mengenal pasti rejim pasaran berbeza, penulis secara efektif mencipta seni bina bersyarat. Ini secara konsepnya lebih unggul daripada memberi makan data berurutan mentah ke dalam LSTM monolitik, yang sering bergelut untuk menyesuaikan keadaan dalamannya kepada dinamik pasaran yang berubah, seperti yang dinyatakan dalam kajian membandingkan RNN tradisional dengan seni bina lebih moden untuk kewangan (contohnya, Borovkova & Tsiamas, 2019).
Integrasi mekanisme perhatian, mungkin diilhamkan oleh kejayaan Transformer dalam NLP (Vaswani et al., 2017), membolehkan model menimbang kepentingan titik sejarah berbeza secara dinamik. Dalam konteks isyarat RSI terlebih jual, model mungkin belajar memberi perhatian kuat kepada peristiwa terlebih jual lalu yang serupa diikuti oleh pembalikan, sambil mengabaikan yang membawa kepada penurunan lanjut. Fokus selektif ini adalah kemajuan utama berbanding purata pergerakan yang memperlakukan semua data lalu sama rata.
Walau bagaimanapun, potensi model bergantung pada kualiti dan keterwakilan data latihannya. Tempoh 2005-2021 termasuk rejim turun naik tertentu. Model yang dilatih pada data ini mungkin gagal semasa rejim novel, seperti persekitaran inflasi tinggi, kadar faedah tinggi pasca-2022—fenomena serupa dengan masalah peralihan domain yang dibincangkan dalam literatur pembelajaran mesin (contohnya, dalam penglihatan komputer dengan CycleGAN (Zhu et al., 2017), tetapi sama kritikal dalam kewangan). Tambahan pula, walaupun penunjuk teknikal berharga, mereka akhirnya ketinggalan. Menggabungkan sumber data alternatif, seperti yang dilakukan oleh dana lindung nilai terkemuka seperti Two Sigma, boleh menjadi lompatan seterusnya yang diperlukan. Ujian sebenar seni bina ini akan keupayaannya untuk menggeneralisasi kepada struktur pasaran tidak dilihat dan prestasinya bersih semua kos dagangan.
7. Butiran Teknikal & Kerangka Matematik
Inovasi teknikal teras terletak pada seni bina model dua peringkat.
Peringkat 1: Pengelompokan Rejim Pasaran
Biarkan $\mathbf{F}_t = [f^1_t, f^2_t, ..., f^m_t]$ menjadi vektor ciri pada masa $t$, mengandungi nilai ternormal penunjuk teknikal (RSI, MACD, kedudukan Bollinger Band, turun naik, dll.). Algoritma pengelompokan $C$ (contohnya, K-Means dengan $k$ kelompok) membahagikan data sejarah kepada $k$ rejim:
$C(\mathbf{F}_t) = r_t \in \{1, 2, ..., k\}$.
Setiap kelompok $r$ mewakili keadaan pasaran berbeza (contohnya, "pasaran menaik trend tinggi," "terikat julat turun naik rendah," "terlebih jual turun naik tinggi").
Peringkat 2: Ramalan Siri Berasaskan Perhatian
Untuk siri vektor ciri terkini $\mathbf{X} = [\mathbf{F}_{t-n}, ..., \mathbf{F}_{t-1}, \mathbf{F}_t]$ dan label rejim bersekutu $r_t$, model bertujuan meramalkan sasaran $y_t$ (contohnya, label binari untuk kenaikan harga selepas isyarat terlebih jual). Mekanisme perhatian mengira vektor konteks $\mathbf{c}_t$ sebagai jumlah berwajaran siri input:
$\mathbf{c}_t = \sum_{i=t-n}^{t} \alpha_i \mathbf{h}_i$,
di mana $\mathbf{h}_i$ adalah perwakilan tersembunyi $\mathbf{F}_i$, dan pemberat perhatian $\alpha_i$ dikira oleh:
$\alpha_i = \frac{\exp(\text{score}(\mathbf{h}_t, \mathbf{h}_i))}{\sum_{j=t-n}^{t} \exp(\text{score}(\mathbf{h}_t, \mathbf{h}_j))}$.
Fungsi pemarkahan boleh menjadi hasil darab titik mudah atau fungsi yang dipelajari. Rejim $r_t$ boleh digabungkan sebagai penyematan yang mempengaruhi keadaan tersembunyi awal atau fungsi pemarkahan perhatian, menjadikan fokus model bersyarat pada keadaan pasaran.
8. Kerangka Analisis & Contoh Kes
Senario: Pasangan EUR/USD, 15 Oktober 2020. RSI jatuh ke 28, menunjukkan keadaan terlebih jual.
Aplikasi Kerangka:
- Pengekstrakan Ciri: Kira vektor ciri $\mathbf{F}_t$: RSI=28, histogram MACD negatif tetapi meningkat, harga menyentuh Bollinger Band bawah, turun naik 30-hari = 8%.
- Klasifikasi Rejim: Model pengelompokan, dilatih pada data 2005-2019, mengambil $\mathbf{F}_t$ dan menetapkannya kepada Kelompok #3, yang telah dilabel "Terlebih Jual dalam Turun Naik Sederhana dengan Momentum Menurun Lemah."
- Ramalan Sedar Konteks: Peramal berasaskan perhatian, kini khusus dikondisikan pada "Kelompok #3," menganalisis data 20 hari lalu. Lapisan perhatian mungkin memberikan pemberat tinggi kepada hari ke-5 dan ke-12 sebelumnya, yang mempunyai profil ciri serupa dan diikuti oleh pemantulan harga 2% dalam 5 hari.
- Output: Model mengeluarkan kebarangkalian tinggi (contohnya, 72%) untuk dagangan pembalikan min berjaya (kenaikan harga >1% dalam 3 hari). Ini memberikan isyarat kuantitatif, kaya konteks jauh melebihi peraturan mudah "RSI < 30".
Nota: Ini adalah contoh konsep. Logik model sebenar akan ditakrifkan oleh parameternya yang dilatih.
9. Aplikasi & Hala Tuju Masa Depan
Seni bina yang dicadangkan mempunyai laluan menjanjikan untuk pengembangan:
- Rejim Pelbagai Aset & Lintas Pasaran: Gunakan pengelompokan sama pada aset berkorelasi (contohnya, mata wang utama Forex, indeks, komoditi) untuk mengenal pasti rejim kewangan global, meningkatkan penilaian risiko sistemik.
- Integrasi dengan Data Alternatif: Gabungkan skor sentimen berita masa nyata (daripada model NLP) atau nada komunikasi bank pusat ke dalam vektor ciri $\mathbf{F}_t$ untuk pengelompokan, mencipta rejim ditakrifkan oleh kedua-dua keadaan teknikal dan asas.
- Integrasi Pembelajaran Pengukuhan (RL): Gunakan model pengelompokan-perhatian sebagai modul perwakilan keadaan dalam ejen RL yang mempelajari polisi dagangan optimum (kemasukan, keluar, saiz kedudukan) untuk setiap rejim dikenal pasti, beralih dari ramalan kepada pengoptimuman strategi langsung.
- AI Boleh Diterangkan (XAI) untuk Peraturan: Bangunkan antara muka penerangan post-hoc yang jelas menunjukkan: "Isyarat dagangan ini dicetuskan kerana pasaran berada dalam Rejim X, dan model memberi fokus pada corak sejarah A, B, dan C." Ini kritikal untuk penerimaan dalam institusi dikawal selia.
- Pembelajaran Dalam Talian Adaptif: Laksanakan mekanisme untuk model pengelompokan mengemas kini secara beransur-ansur dengan data baru, membolehkannya mengenali dan menyesuaikan diri kepada rejim pasaran baru sepenuhnya secara masa nyata, mengurangkan risiko kerosakan model.
10. Rujukan
- López de Prado, M. (2018). Advances in Financial Machine Learning. Wiley.
- Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems 30 (NIPS 2017).
- Borovkova, S., & Tsiamas, I. (2019). An ensemble of LSTM neural networks for high-frequency stock market classification. Journal of Forecasting, 38(6), 600-619.
- Zhu, J.-Y., et al. (2017). Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. IEEE International Conference on Computer Vision (ICCV).
- Murphy, J. J. (1999). Technical Analysis of the Financial Markets. New York Institute of Finance.
- Investopedia. (n.d.). Technical Indicators. Diambil dari https://www.investopedia.com.