1. Utangulizi
Utabiri sahihi wa kiwango cha ubadilishaji wa RMB/USD ni changamoto muhimu katika fedha za kimataifa, ikiachia athari biashara, uwekezaji, na sera ya fedha. Mienendo ya kawaida ya kutokuwa na uhakika na changamano, isiyo ya mstari ya masoko ya fedha za kigeni hufanya mifano ya kawaida ya uchumi isitoshe. Utafiti huu unashughulikia pengo hili kwa kutathmini kwa utaratibu mifano ya hali ya juu ya kujifunza kwa kina (DL)—ikiwemo Kumbukumbu ya Muda Mrefu-Mfupi (LSTM), Mtandao wa Neural wa Convolutional (CNN), na miundo ya msingi ya Transformer—kwa utabiri wa kiwango cha ubadilishaji. Uvumbuzi muhimu ni kuunganishwa kwa mbinu za AI zinazoelezeka (XAI), hasa Ramani ya Uanzishaji wa Darasa yenye Uzito wa Gradient (Grad-CAM), ili kufafanua maamuzi ya mfano na kutambua vipengele vya kiuchumi na kifedha vinavyochangia zaidi.
2. Mbinu & Mifano
2.1 Data & Uhandisi wa Vipengele
Utafiti huu unatumia seti kamili ya data ya vipengele 40 katika makundi 6 kutabiri kiwango cha RMB/USD. Makundi ya vipengele ni pamoja na:
- Viashiria vya Kiuchumi Kikuu: Ukuaji wa GDP, viwango vya mfumuko wa bei (CPI, PPI), tofauti za viwango vya riba.
- Biashara & Mtiririko wa Mtaji: Ujazo wa biashara ya pande mbili kati ya China na Marekani, mizania ya akaunti ya sasa.
- Viwango vya Ubadilishaji Vinavyohusiana: Jozi za fedha za kigeni kama EUR/RMB na USD/JPY.
- Hali ya Soko & Kutokuwa na Hakika: Viashiria vya kutokuwa na hakika vilivyoelezwa, bei za bidhaa (mfano, mafuta).
- Sera ya Fedha: Viwango vya sera ya benki kuu na mahitaji ya akiba.
- Viashiria vya Kiufundi: Wastani wa kusonga, oscillators ya msukumo inayotokana na data ya bei ya kihistoria.
Mchakato mkali wa uteuzi wa vipengele ulitumika kupunguza ukubwa na kuangazia vigeu vinavyotabiri zaidi, ukisisitiza viendeshi vya msingi vya kiuchumi kuliko kelele.
2.2 Miundo ya Kina ya Kujifunza
Utafiti ulilinganisha mifano kadhaa ya hali ya juu:
- LSTM: Inashika utegemezi wa muda mrefu katika data ya mlolongo.
- CNN: Inatoa muundo wa ndani na vipengele katika data ya mfululizo wa wakati.
- Transformer: Inatumia utaratibu wa kujipa umuhimu wa hatua tofauti za wakati na vipengele kwa ujumla.
- TSMixer: Mfano wa msingi wa MLP ulioundwa kwa utabiri wa mfululizo wa wakati, ambao ulifanya vizuri zaidi katika utafiti huu. Unatumia tabaka nene katika vipimo vya wakati na vipengele, ukitoa muundo rahisi lakini wenye ufanisi mkubwa wa kushika mwingiliano changamano.
2.3 Uelewevu kwa Grad-CAM
Ili kuzidi njia ya "sanduku nyeusi", waandishi walitumia Grad-CAM, mbinu iliyotengenezwa awali kwa uono wa kompyuta (Selvaraju et al., 2017), kwa utabiri wa mfululizo wa wakati. Grad-CAM hutoa ramani ya joto inayoangazia ni vipengele gani vya ingizo (na katika hatua gani za wakati) vilikuwa muhimu zaidi kwa utabiri wa mfano. Hii inaruhusu wachambuzi kuthibitisha ikiwa mwelekeo wa mfano unalingana na uelewa wa kiuchumi—kwa mfano, kukipa kipaumbele data ya ujazo wa biashara wakati wa vipindi vya mvutano wa biashara ulioongezeka.
3. Matokeo ya Majaribio
3.1 Vipimo vya Utendaji
Mifano ilitathminiwa kwa kutumia vipimo vya kawaida: Kosa la Wastani la Thamani Kamili (MAE), Kosa la Mzizi wa Wastani wa Mraba (RMSE), na Kosa la Wastani la Asilimia Kamili (MAPE).
Muhtasari wa Utendaji wa Mfano (Data ya Kubuni)
Mfano Bora Zaidi (TSMixer): RMSE = 0.0052, MAPE = 0.68%
Transformer: RMSE = 0.0058, MAPE = 0.75%
LSTM: RMSE = 0.0061, MAPE = 0.80%
CNN: RMSE = 0.0065, MAPE = 0.85%
Kumbuka: Matokeo maalum ya nambari yanatoa mfano kulingana na hadithi ya karatasi ya ubora wa TSMixer.
3.2 Matokeo Muhimu & Uwasilishaji wa Kuona
Mfano wa TSMixer ulitoa utabiri sahihi zaidi kila wakati. Muhimu zaidi, uwasilishaji wa Grad-CAM ulifunua uelewa unaoweza kutekelezwa:
- Umuhimu wa Kipengele: Mfano ulipa uzito mkubwa kwa ujazo wa biashara China-Marekani na kiwango cha ubadilishaji wa EUR/RMB, ukithibitisha umuhimu wa uhusiano wa msingi wa biashara na ubadilishaji wa fedha za kigeni.
- Mwelekeo wa Wakati: Wakati wa vipindi vya soko visivyo na uhakika (mfano, baada ya mageuzi ya 2015, msuguano wa biashara wa 2018), umakini wa mfano ulibadilika kwa kasi kuelekea viashiria vya hali vya msingi wa habari na tarehe za matangazo ya sera.
- Maelezo ya Chati: Ramani ya joto ya kubuni ya Grad-CAM ingeonyesha uwasilishaji wa safu nyingi. Kila safu inawakilisha kipengele (mfano, Ujazo_Biashara, EUR_RMB). Mhimili wa x ni wakati. Seluli zimepakwa rangi kutoka bluu (umuhimu mdogo) hadi nyekundu (umuhimu mkubwa). Vipindi muhimu vinaonyesha mistari nyekundu mkali kwenye vipengele vya msingi, ikielezea kwa kuona utabiri.
4. Uchambuzi & Majadiliano
4.1 Uelewa Msingi & Mtiririko wa Mantiki
Uelewa Msingi: Mchango wenye thamani zaidi wa karatasi sio tu kwamba kujifunza kwa kina kunafanya kazi, lakini kwamba miundo rahisi, iliyobuniwa vizuri (TSMixer) inaweza kufanya vizuri kuliko ile changamano (Transformer) kwa kazi maalum za utabiri wa kifedha, hasa wakati inaunganishwa na uhandisi mkali wa vipengele na zana za uelewevu. Mtiririko wa mantiki ni sahihi: tambua changamoto ya utabiri, jaribu seti ya mifano ya kisasa ya DL, kisha tumia XAI kuthibitisha na kufasiri mantiki ya mshindi. Hii inahamisha uwanja kutoka utendaji wa utabiri tu hadi utendaji unaoweza kukaguliwa.
4.2 Nguvu & Kasoro Muhimu
Nguvu:
- Ujumuishaji wa Vitendo wa XAI: Kutumia Grad-CAM kwa fedha za mfululizo wa wakati ni hatua ya busara na ya vitendo kuelekea kuaminika kwa mfano, kikwazo kikubwa katika utumiaji wa tasnia.
- Njia ya Kuelekea Vipengele: Msisitizo kwenye vipengele vya msingi vya kiuchumi (biashara, viwango vya ubadilishaji) badala ya uchambuzi wa kiufundi tu hufanya mfano uwe na msingi wa hali halisi ya kiuchumi.
- Ulinganisho Mzuri: Kulinganisha LSTM, CNN, na Transformer hutoa kiwango cha kisasa cha kulinganisha kwa uwanja huo.
- Hatari ya Kufanya Makosa Makubwa Imepitwa: Kwa vipengele 40 na mifano changamano, karatasi ilikabiliwa na hatari kubwa ya kufanya makosa makubwa. Maelezo juu ya udhibiti (kutupa, kuharibika kwa uzito) na vipindi vikali vya majaribio nje ya sampuli (mfano, kupitia kutokuwa na uhakika wa COVID-19) ni muhimu na hayajaripotiwa vya kutosha.
- Upendeleo wa Kuchungulia Data: Mchakato wa uteuzi wa vipengele, ingawa ni mkali, kwa asili huleta upendeleo wa kutazama mbele ikiwa haujasimamiwa kwa uangalifu na madirisha yanayozunguka. Hii ndiyo hatari kuu ya karatasi nyingi za ML za fedha.
- Ukosefu wa Jaribio la Mshtuko wa Kiuchumi: TSMixer ilifanya vipi wakati wa matukio ya kweli ya "bata mweusi"? Utendaji wake wakati wa mageuzi ya 2015 umeainishwa, lakini jaribio la mkazo dhidi ya kushuka kwa soko la 2020 au mabadiliko ya Fed ya 2022 kingekuwa na maana zaidi.
- Ulinganisho na Viwango Rahisi: Je, ilifanya vizuri zaidi kuliko mfano rahisi wa ARIMA au kutembea bila mpangilio? Wakati mwingine, ugumu huongeza faida ndogo kwa gharama kubwa.
4.3 Uelewa Unaoweza Kutekelezwa
Kwa wataalam wa fedha na taasisi za kifedha:
- Kipaumbele TSMixer kwa Miradi ya Majaribio: Usawa wake wa utendaji na urahisi hufanya iwe mahali pa kuanzia pa hatari ndogo, faida kubwa kwa mifumo ya utabiri wa fedha za kigeni ya ndani.
- Weka Lazima XAI kwa Uthibitishaji wa Mfano: Sistiza zana kama Grad-CAM sio kama kitu cha baadaye, bali kama sehemu kuu ya mzunguko wa maendeleo ya mfano. "Mantiki" ya mfano lazima ikaguliwe kabla ya kutekelezwa.
- Lenga Maktaba ya Vipengele, Sio Mifano Tu: Wekeza katika kujenga na kudumisha seti za data za ubora wa juu, zenye ucheleweshaji mdogo kwa makundi 6 ya vipengele yaliyotambuliwa. Mfano ni mzuri kama mafuta yake.
- Tekeleza Uthibitishaji Mkali wa Msalaba wa Wakati: Ili kupambana na kuchungulia data, tumia itifaki kali za majaribio ya nyuma ya asili inayozunguka kama ilivyoelezewa katika tafiti kutoka Benki Kuu ya Marekani (mfano, kazi yao ya utabiri wa sasa).
5. Uchunguzi wa Kina wa Kiufundi
5.1 Uundaji wa Kihisabati
Changamoto kuu ya utabiri imeundwa kama kutabiri kiwango cha ubadilishaji cha kipindi kijacho $y_{t+1}$ ikizingatiwa mfululizo wa wakati wa vipengele vingi $\mathbf{X}_t = \{x^1_t, x^2_t, ..., x^F_t\}$ katika dirisha la kutazama nyuma la $L$ vipindi: $\{\mathbf{X}_{t-L}, ..., \mathbf{X}_t\}$.
Tabaka la TSMixer (Iliorahisishwa): Operesheni muhimu katika TSMixer inajumuisha aina mbili za mchanganyiko wa MLP:
- Mchanganyiko wa Wakati: $\mathbf{Z} = \sigma(\mathbf{W}_t \cdot \mathbf{X} + \mathbf{b}_t)$ hutumia tabaka nene katika mwelekeo wa wakati kwa kila kipengele kwa kujitegemea, ikishika muundo wa wakati.
- Mchanganyiko wa Vipengele: $\mathbf{Y} = \sigma(\mathbf{W}_f \cdot \mathbf{Z}^T + \mathbf{b}_f)$ hutumia tabaka nene katika mwelekeo wa kipengele katika kila hatua ya wakati, ikielezea mwingiliano kati ya viashiria tofauti vya kiuchumi.
Grad-CAM kwa Mfululizo wa Wakati: Kwa utabiri lengwa $\hat{y}$, alama ya umuhimu $\alpha^c_k$ kwa kipengele $k$ inahesabiwa kwa uenezi wa gradient: $$\alpha^c_k = \frac{1}{T} \sum_{t} \frac{\partial \hat{y}^c}{\partial A^k_t}$$ ambapo $A^k_t$ ni uanzishaji wa tabaka ya mwisho ya convolutional au nene kwa kipengele $k$ kwa wakati $t$. Ramani ya mwisho ya joto ya Grad-CAM $L^c_{Grad-CAM}$ ni mchanganyiko wenye uzito wa uanzishaji huu: $L^c_{Grad-CAM} = ReLU(\sum_k \alpha^c_k A^k)$. ReLU inahakikisha tu vipengele vilivyo na ushawishi chanya vinaonyeshwa.
5.2 Mfano wa Mfumo wa Uchambuzi
Kesi: Kuchambua Mwelekeo wa Mfano Wakati wa Tangazo la Sera
Hali: Fed inatangaza ongezeko la riba la kushangaza. Mfano wako wa TSMixer unatabiri kupungua kwa thamani ya RMB.
- Hatua 1 - Tokeza Utabiri & Grad-CAM: Endesha mfano kwa kipindi kinachofuata tangazo. Toa ramani ya joto ya Grad-CAM.
- Hatua 2 - Fasiri Ramani ya Joto: Tambua safu gani za vipengele (mfano, `USD_Index`, `CN_US_Interest_Diff`) zinaonyesha uanzishaji wa juu (nyekundu) wakati na mara moja baada ya hatua ya wakati ya tangazo.
- Hatua 3 - Thibitisha kwa Uelewa: Je, mwelekeo wa mfano unalingana na nadharia? Mwelekeo mkubwa kwenye tofauti za viwango vya riba unathibitisha mfano. Ikiwa ulilenga hasa, kwa mfano, `Oil_Price`, ingeleta alama nyekundu inayohitaji uchunguzi wa uhusiano wa uwongo.
- Hatua 4 - Hatua: Ikiwa imethibitishwa, uelewa huo huongeza ujasiri katika kutumia mfano kwa uchambuzi wa hali karibu na mikutano ya baadaye ya Fed. Ramani ya joto hutoa ripoti ya moja kwa moja, ya kuona kwa wadau.
6. Matumizi ya Baadaye & Mwelekeo
Mbinu iliyoanzishwa hapa ina matumizi mapana zaidi ya RMB/USD:
- Utabiri wa Mali Nyingi: Kutumia TSMixer+Grad-CAM kwa jozi nyingine za fedha, kutokuwa na uhakika wa fedha za dijiti, au utabiri wa bei ya bidhaa.
- Uchambuzi wa Athari ya Sera: Benki kuu zinaweza kutumia mifano hii inayoelezeka kuiga athari ya soko ya mabadiliko ya sera yanayoweza kutokea, kuelewa njia gani (viwango vya riba, mwongozo wa mbele) soko linavyohisi zaidi.
- Usimamizi wa Hatari wa Wakati Halisi: Kuunganisha mfumo huu kwenye dashibodi za biashara za wakati halisi, ambapo Grad-CAM inaangazia mabadiliko katika viashiria vinavyosukuma wakati habari zinapotoka, ikiruhusu marekebisho ya mikakati ya kinga inayobadilika.
- Ujumuishaji na Data Mbadala: Kazi ya baadaye lazima ijumuishe data isiyo na muundo (hali ya habari kutoka kwa mifano ya NLP, toni ya hotuba za benki kuu) kama vipengele vya ziada, kwa kutumia mfumo huo wa uelewevu kupima athari yao dhidi ya msingi wa jadi.
- Ugunduzi wa Sababu: Mipaka ijayo ni kusonga kutoka uhusiano (unaounguzwa na Grad-CAM) hadi sababu. Mbinu kama vile algoriti za ugunduzi wa sababu (mfano, PCMCI) zinaweza kuunganishwa na mifano ya DL kutofautisha viashiria vya msingi na muundo wa bahati nasibu.
7. Marejeo
- Meng, S., Chen, A., Wang, C., Zheng, M., Wu, F., Chen, X., Ni, H., & Li, P. (2023). Enhancing Exchange Rate Forecasting with Explainable Deep Learning Models. Manuscript in preparation.
- Selvaraju, R. R., Cogswell, M., Das, A., Vedantam, R., Parikh, D., & Batra, D. (2017). Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization. Proceedings of the IEEE International Conference on Computer Vision (ICCV), 618-626.
- Chen, S., & Hardle, W. K. (2023). AI in Finance: Challenges, Advances, and Opportunities. Annual Review of Financial Economics, 15.
- Federal Reserve Bank of New York. (2022). Nowcasting with Large Datasets. Staff Reports. Retrieved from https://www.newyorkfed.org/research/staff_reports
- Diebold, F. X., & Yilmaz, K. (2015). Financial and Macroeconomic Connectedness: A Network Approach to Measurement and Monitoring. Oxford University Press.