Utabiri wa EUR/USD kwa LLM na Ujifunzaji wa Kina: Mfumo wa IUS

1. Utangulizi

Utabiri sahihi wa kiwango cha ubadilishaji wa sarafu ya EUR/USD ni changamoto muhimu kwa fedha za kimataifa, ikiwathiri wawekezaji, makampuni ya kimataifa, na wanaoanzisha sera. Miundo ya jadi ya kiuchumi, inayotegemea viashiria vya kimakro vya kiuchumi vilivyopangwa, mara nyingi haishiki msukosuko wa soko la wakati halisi na athari ya kina ya habari na matukio ya kisiasa-kijiografia. Karatasi hii inatanguliza mfumo wa IUS (Taarifa-Uliyounganishwa-Uliyopangwa), njia mpya inayounganisha data ya maandishi isiyopangwa (habari, uchambuzi) na data ya kiasi iliyopangwa (viwango vya ubadilishaji, viashiria vya kifedha) ili kuboresha usahihi wa utabiri. Kwa kutumia Mfano Mkubwa wa Lugha (LLM) kwa ajili ya uchambuzi wa hali ya juu wa hisia na uainishaji wa mienendo, na kuunganisha maarifa haya na mtandao wa Kumbukumbu ya Muda Mfupi wa Mwelekeo Mbili (Bi-LSTM) ulioboreshwa na Optuna, njia inayopendekezwa inashughulikia mapungufu makuu katika mifumo ya sasa ya utabiri.

2. Mfumo wa IUS: Usanifu na Mbinu

Mfumo wa IUS ni mfuatano wa utaratibu ulioundwa kwa ajili ya kuunganisha data ya kifedha kutoka vyanzo mbalimbali na uundaji wa miundo ya utabiri.

2.1. Uunganishaji wa Data kutoka Vyanzo Mbalimbali

Mfumo huu unachukua mtiririko kuu wa data mbili:

Data Iliyopangwa: Viwango vya kihistoria vya ubadilishaji wa EUR/USD, viashiria muhimu vya kifedha (k.m., viwango vya riba, fahirisi za mfumuko wa bei, takwimu za GDP).
Data ya Maandishi Isiyopangwa: Makala za habari, ripoti za kifedha, na uchambuzi wa soko unaohusiana na uchumi wa Jumuiya ya Ulaya na Marekani.

Muunganiko huu unalenga kushika historia ya kiasi na hisia ya ubora inayoongoza mienendo ya soko.

2.2. Uchimbaji wa Vipengele vya Maandishi vinavyotumia LLM

Ili kushinda changamoto za kelele na semantiki ngumu katika maandishi ya kifedha, mfumo hutumia Mfano Mkubwa wa Lugha (k.m., mfano kama GPT au BERT) kwa uchambuzi wa madhumuni mawili:

Upimaji wa Mwelekeo wa Hisia: Hupeana alama ya nambari ya hisia (k.m., -1 kwa mwelekeo wa kushuka, +1 kwa mwelekeo wa kupanda) kwa kila hati ya maandishi.
Uainishaji wa Mienendo ya Kiwango cha Ubadilishaji: Hainisha moja kwa moja utabiri unaodokezwa na maandishi kuhusu mienendo ya EUR/USD (k.m., Kupanda, Kushuka, Thabiti).

Hatua hii hubadilisha maandishi yasiyopangwa kuwa vipengele vya nambari vinavyoweza kutekelezwa.

2.3. Kizazi cha Vipengele vinavyochochewa na Uhusiano wa Sababu

Vipengele vya maandishi vilivyozalishwa vinaunganishwa na vipengele vya kiasi vilivyotayarishwa. Moduli ya uchambuzi wa uhusiano wa sababu (yenye uwezekano wa kutumia mbinu kama uhusiano wa sababu wa Granger au utaratibu wa umakini) hutumiwa kutambua na kupima uzito wa vipengele kulingana na uhusiano wao wa sababu wa kutabiri kuhusu kiwango cha ubadilishaji cha baadaye, badala ya uhusiano wa kawaida tu. Hii inahakikisha mfumo unazingatia viendeshaji muhimu zaidi.

2.4. Mfano wa Bi-LSTM ulioboreshwa na Optuna

Seti ya vipengele vilivyounganishwa huingizwa kwenye mtandao wa Bi-LSTM. Bi-LSTM huchakata mfuatano katika mwelekeo wa mbele na wa nyuma, ikishika muktadha wa zamani na wa baadaye kwa ufanisi zaidi kwa utabiri wa mfululizo wa wakati. Vigezo vya juu (k.m., idadi ya tabaka, vitengo vya siri, kiwango cha kushuka, kiwango cha kujifunza) huboreshwa kiotomatiki kwa kutumia Optuna, mfumo wa ubora wa vigezo vya juu wa Bayesian, ili kupata usanidi bora zaidi wa mfano.

3. Usanidi wa Majaribio na Matokeo

3.1. Seti ya Data na Miundo ya Msingi

Majaribio yalifanywa kwenye seti ya data inayoshughulikia miaka kadhaa ya viwango vya kila siku vya EUR/USD, viashiria vinavyolingana vya kimakro vya kiuchumi, na habari za kifedha zilizolinganishwa. Mfumo wa IUS uliopendekezwa na Optuna-Bi-LSTM ulilinganishwa na miundo kadhaa dhabiti ya msingi, ikijumuisha:

Miundo ya kawaida ya LSTM na Bi-LSTM ikitumia data iliyopangwa pekee.
Miundo mseto ya CNN-LSTM.
Miundo ya jadi ya kiuchumi (k.m., ARIMA).

3.2. Vipimo vya Utendaji na Matokeo

Utendaji wa mfano ulitathminiwa kwa kutumia vipimo vya kawaida vya urejeshaji: Hitilafu Kamili ya Wastani (MAE) na Hitilafu ya Mzizi wa Wastani wa Mraba (RMSE).

Matokeo Muhimu ya Majaribio

Mfano wa IUS + Optuna-Bi-LSTM ulipata utendaji bora zaidi:

Ilipunguza MAE kwa 10.69% ikilinganishwa na mfano bora zaidi wa msingi.
Ilipunguza RMSE kwa 9.56%.

Ufafanuzi: Hii inaonyesha uboreshaji mkubwa na thabiti katika usahihi wa utabiri, na kupungua kwa RMSE kukiashiria usimamizi bora wa makosa makubwa (matokeo yasiyo ya kawaida).

3.3. Uchunguzi wa Uondoaji na Umuhimu wa Vipengele

Uchunguzi wa uondoaji umehakikisha thamani ya kuunganisha data:

Miundo ikitumia data iliyopangwa pekee ilifanya vibaya kuliko mfumo kamili wa IUS.
Muunganiko wa data isiyopangwa (maandishi) na data iliyopangwa ulitoa usahihi wa juu zaidi.
Uchaguzi wa vipengele ulifunua kuwa usanidi bora ulitumia vipengele 12 muhimu zaidi vya kiasi vilivyounganishwa na vipengele vya maandishi vilivyozalishwa na LLM.

4. Uchunguzi wa Kina wa Kiufundi

Muundo Msingi wa Hisabati: Uendeshaji wa seli ya Bi-LSTM unaweza kufupishwa. Kwa hatua fulani ya wakati $t$ na ingizo $x_t$, LSTM ya mbele inakokotoa hali ya siri $\overrightarrow{h_t}$ na LSTM ya nyuma inakokotoa $\overleftarrow{h_t}$. Matokeo ya mwisho $h_t$ ni muunganiko: $h_t = [\overrightarrow{h_t}; \overleftarrow{h_t}]$.

Kazi ya hasara inayopunguzwa wakati wa mafunzo kwa kawaida ni Hitilafu ya Mraba ya Wastani (MSE): $$L = \frac{1}{N} \sum_{i=1}^{N} (y_i - \hat{y}_i)^2$$ ambapo $y_i$ ndio kiwango halisi cha baadaye cha ubadilishaji na $\hat{y}_i$ ndio utabiri wa mfano.

Jukumu la Optuna: Optuna hufanya utafutaji wa vigezo vya juu $\theta$ (k.m., kiwango cha kujifunza $\eta$, vitengo vya LSTM) kuwa otomatiki kwa kufafanua kazi ya lengo $f(\theta)$ (k.m., RMSE ya seti ya uthibitishaji) na kuchunguza nafasi ya vigezo kwa ufanisi kwa kutumia algoriti za Kikadiriaji cha Parzen kilichoundwa kama Mti (TPE), kama ilivyoelezewa kwa kina katika karatasi yao ya msingi [Akiba et al., 2019].

5. Mfumo wa Uchambuzi: Kesi ya Vitendo

Hali: Kutabiri mienendo ya EUR/USD kwa siku inayofuata ya biashara baada ya tangazo la sera ya Benki Kuu ya Ulaya (ECB).

Ukusanyaji wa Data: Kukusanya taarifa ya siku ya ECB, muhtasari wa wachambuzi kutoka Reuters/Bloomberg, na data iliyopangwa (EUR/USD ya sasa, faida ya dhamana, fahirisi ya msukosuko).
Usindikaji wa LLM: Kuingiza hati za maandishi kwenye moduli ya LLM. Mfano hutoa: Alama ya Hisia = +0.7 (mwelekeo wa kupanda kwa wastani), Uainishaji wa Mienendo = "Kupanda".
Unganishaji wa Vipengele: Alama hizi zinaunganishwa na vipengele 12 vilivyochaguliwa vya kiasi (k.m., tofauti ya faida ya miaka 10, mapato ya siku iliyopita).
Kupima Uzito kwa Uhusiano wa Sababu: Kizazi cha vipengele hupeana uzito wa juu zaidi kwa "Alama ya Hisia" na "Tofauti ya Faida" kulingana na athari ya kihistoria ya sababu.
Utabiri: Vekta ya vipengele vilivyopimwa uzito huingizwa kwenye Optuna-Bi-LSTM iliyofunzwa, ambayo hutoa thamani maalum ya kiwango cha ubadilishaji kilichotabiriwa.

Kesi hii inaonyesha jinsi mfumo unavyobadilisha matukio ya ulimwengu halisi kuwa utabiri unaoweza kupimika na kutekelezwa.

6. Matumizi ya Baadaye na Mwelekeo wa Utafiti

Utabiri wa Mwingiliano wa Mali: Kutumia mfumo wa IUS kwa jozi nyingine za sarafu (k.m., GBP/USD, USD/JPY) na mali zinazohusiana kama hisa au bidhaa.
Mifumo ya Utabiri wa Wakati Halisi: Kuunda mifuatano ya utaratibu wa latensi ya chini kwa biashara ya ndani ya siku, inayohitaji LLMs zenye ufanisi, zilizochujwa na uunganishaji wa data ya mtiririko.
Unganishaji wa AI Inayoweza Kufafanuliwa (XAI): Kujumuisha mbinu kama SHAP au LIME ili kufafanua kwa nini mfano ulifanya utabiri maalum, jambo muhimu kwa kufuata kanuni na imani ya wafanyabiashara. Rasilimali kama kitabu Interpretable Machine Learning cha Christoph Molnar hutoa msingi wa hili.
LLMs za Njia Nyingi: Kutumia LLMs za kizazi kijacho ambazo zinaweza kusindika sio maandishi tu bali pia sauti (mazungumzo ya mapato) na data kutoka kwenye chati/grafu kwa muktadha tajiri zaidi.
Uchaguzi wa Kigeugeu cha Vipengele: Kuhamia kutoka kwenye seti ya vipengele 12 vya juu vilivyowekwa hadi utaratibu wa umuhimu wa vipengele unaobadilika kwa wakati.

7. Marejeo

Akiba, T., Sano, S., Yanase, T., Ohta, T., & Koyama, M. (2019). Optuna: A Next-generation Hyperparameter Optimization Framework. Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining.
Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. Neural Computation, 9(8), 1735–1780.
Molnar, C. (2020). Interpretable Machine Learning: A Guide for Making Black Box Models Explainable. https://christophm.github.io/interpretable-ml-book/
Singh, et al. (2023). [Utafiti unaolingana wa msingi kuhusu maandishi ya Weibo na CNN-LSTM].
Tadphale, et al. (2022). [Utafiti unaolingana wa msingi kuhusu vichwa vya habari na LSTM].
Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems, 30.

8. Kona ya Mchambuzi: Uchambuzi Muhimu

Uelewa Msingi: Karatasi hii sio tu mradi mwingine wa "AI kwa ajili ya fedha"; ni mashambulio ya lengo dhidi ya dosari inayodumu zaidi katika fedha za kiasi: ucheleweshaji wa kuunganisha kati ya habari na nambari. Waandishi wametambua kwa usahihi kwamba hisia ni kiashiria cha kuongoza, lakini zana za jadi za NLP ni pana mno kwa masimulizi ya kina, ya mwelekeo mbili ya forex. Matumizi yao ya LLMs kama kiwanda cha semantiki cha kutoa vipengele safi, vya mwelekeo vya hisia ndio hatua muhimu ya kiakili. Ni hatua kutoka kwenye mfuko wa maneno hadi kwenye mfano wa kuelewa, sawa na jinsi mfumo wa CycleGAN wa kutafsiri picha zisizolingana [Zhu et al., 2017] ulianzisha dhana mpya kwa kujifunza ramani kati ya nyanja bila mawasiliano madhubuti.

Mtiririko wa Kimantiki: Usanifu una mantiki. Mfuatano—Uchimbaji wa Vipengele wa LLM → kuchuja kwa uhusiano wa sababu → uundaji wa mfuatano ulioboreshwa—huonyesha vitendo bora katika ML ya kisasa: tumia mfano msingi wenye nguvu kwa uhandisi wa vipengele, anzisha upendeleo wa kufundisha (uhusiano wa sababu) ili kupambana na kuzidi kufundisha, na kisha acha mtabiri maalum (Bi-LSTM) afanye kazi yake kwa vigezo vilivyoboreshwa. Uunganishaji wa Optuna ni kigeugeu cha vitendo, kukiri kwamba utendaji wa mfano mara nyingi huzuiwa na ugumu wa vigezo vya juu.

Nguvu na Mapungufu: Nguvu kuu ni ufanisi ulioonyeshwa (kupungua kwa 10.69% kwa MAE ni kikubwa katika forex) na suluhisho zuri la tatizo la "maandishi ya nchi mbili" kupitia uainishaji wa LLM. Hata hivyo, dosari ya karatasi ni ya kukosa: ucheleweshaji wa uendeshaji na gharama. Kukokotoa hitimisho kwenye LLMs kubwa kwa kila kipengee cha habari ni ghali na polepole kwa kihesabu. Kwa biashara ya mzunguko wa juu (HFT), mfumo huu kwa sasa haufai. Zaidi ya hayo, "Kizazi cha Vipengele vinavyochochewa na Uhusiano wa Sababu" hakijafafanuliwa kikamilifu—je, ni uhusiano wa sababu wa Granger, kifuniko cha umakini kilichojifunza, au kitu kingine? Sanduku hili jeusi linaweza kuwa suala la uwezekano wa kurudiwa.

Uelewa Unaoweza Kutekelezwa: Kwa wataalamu wa kiasi na wasimamizi wa mali, hitimisho ni wazi: Kipaumbele kwa ubora wa ishara za hisia juu ya kiasi. Kuwekeza katika kuboresha LLM ndogo, maalum ya nyanja (kama FinBERT) kwenye mkusanyiko wa forex kunaweza kutoa faida nyingi kwa sehemu ndogo ya gharama na ucheleweshaji. Mwelekeo wa utafiti unapaswa kugeukia ufanisi—kuchunguza usafishaji wa maarifa kutoka kwa LLMs kubwa hadi kwenye miundo midogo, na uwezo wa kufafanuliwa—kutumia uzito wa umakini kutoka kwa LLM na Bi-LSTM kutoa "ripoti za hoja" za biashara, jambo muhimu kwa kufuata kanuni za hazina. Mshindi wa baadaye katika nafasi hii hatakuwa na mfano sahihi zaidi tu, bali utakuwa wa kasi zaidi, wa bei nafuu zaidi, na wa uwazi zaidi.