Chagua Lugha

Uboreshaji wa Miundo ya LSTM kwa Utabiri wa EUR/USD Pamoja na Uchambuzi wa Ufanisi wa Nishati

Uchambuzi wa utendaji wa muundo wa LSTM kwa utabiri wa Forex kwa kutumia viashiria MSE, MAE, R-squared, kwa kuzingatia kupunguza matumizi ya nishati ya kompyuta.
computecurrency.net | PDF Size: 0.3 MB
Ukadiriaji: 4.5/5
Ukadiriaji Wako
Umekadiria waraka huu tayari
Kifuniko cha Waraka PDF - Uboreshaji wa Miundo ya LSTM kwa Utabiri wa EUR/USD Pamoja na Uchambuzi wa Ufanisi wa Nishati

Yaliyomo

1. Utangulizi

Soko la Kubadilishana Fedha za Kigeni (Forex), lenye ujazo wa biashara ya kila siku unaozidi trilioni $5, linawakilisha soko kubwa zaidi la kifedha duniani. Kutabiri kwa usahihi viwango vya kubadilishana fedha, hasa kwa jozi kuu kama EUR/USD, ni muhimu sana kwa usimamizi wa hatari na kuongeza faida. Utafiti huu huchunguza matumizi ya mitandao ya neva ya Kumbukumbu ya Muda Mrefu-Mfupi (LSTM) kwa kazi hii, kwa kuzingatia mambo mawili muhimu: usahihi wa utabiri na ufanisi wa nishati ya kompyuta. Utafiti huu hutathmini utendaji wa muundo kwa kutumia viashiria vya kawaida—Kosa la Wastani la Mraba (MSE), Kosa la Wastani la Thamani Kamili (MAE), na R-squared—wakati huo huo ukizingatia athari za kimazingira za kuendesha miundo hiyo yenye utata mkubwa wa kompyuta.

2. Mapitio ya Fasihi

Uundaji wa miundo ya utabiri katika Forex umekua kutoka kwenye uchambuzi wa jadi wa kiufundi na wa kimsingi hadi kwenye mbinu za kisasa za mashine kujifunza. Mbinu za awali zilitegemea miundo ya takwimu ya mfululizo wa wakati kama ARIMA. Kuja kwa mashine kujifunza kulileta mbinu kama vile Mashine ya Vekta ya Msaada (SVMs) na Mitandao ya Neva ya Bandia (ANNs). Hivi karibuni zaidi, miundo ya kina ya kujifunza, hasa Mitandao ya Neva ya Kurudia (RNNs) na lahaja yake ya LSTM, imepata umaarufu kutokana na uwezo wao wa kukamata utegemezi wa muda mrefu katika data ya kifedha ya mfululizo. Hata hivyo, fasihi mara nyingi hupuuza gharama kubwa ya kompyuta na matumizi ya nishati yanayohusishwa na kufundisha na kuendesha miundo hii changamano, pengo ambalo utafiti huu unalenga kushughulikia.

3. Mbinu

3.1 Utayarishaji wa Data

Data ya kihistoria ya kiwango cha kubadilishana EUR/USD ilikusanywa na kutayarishwa upya. Hatua za kawaida za utayarishaji data ya kifedha zilitumika, zikiwemo kushughulikia thamani zilizokosekana, kusawazisha kwa kiwango cha vipengele kati ya 0 na 1 kwa kutumia kiwango cha Min-Max, na kuunda madirisha ya mfululizo wa wakati yanayofaa kwa pembejeo ya LSTM.

3.2 Muundo wa Mfumo wa LSTM

Kiini cha seli ya LSTM kinaweza kuelezewa kwa milango na milinganyo ifuatayo ya hali ya seli:

  • Lango la Kusahau: $f_t = \sigma(W_f \cdot [h_{t-1}, x_t] + b_f)$
  • Lango la Pembejeo: $i_t = \sigma(W_i \cdot [h_{t-1}, x_t] + b_i)$
    $\tilde{C}_t = \tanh(W_C \cdot [h_{t-1}, x_t] + b_C)$
  • Sasisho la Hali ya Seli: $C_t = f_t * C_{t-1} + i_t * \tilde{C}_t$
  • Lango la Matokeo: $o_t = \sigma(W_o \cdot [h_{t-1}, x_t] + b_o)$
    $h_t = o_t * \tanh(C_t)$

Ambapo $\sigma$ ni kitendakazi cha sigmoid, $*$ inaashiria kuzidisha kwa kila kipengele, $W$ ni matriki za uzani, $b$ ni vekta za upendeleo, $x_t$ ni pembejeo, $h_t$ ni hali iliyofichwa, na $C_t$ ni hali ya seli.

3.3 Viashiria vya Tathmini

Utendaji wa muundo ulikadiriwa kwa kiasi kwa kutumia:

  • Kosa la Wastani la Mraba (MSE): $MSE = \frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2$
  • Kosa la Wastani la Thamani Kamili (MAE): $MAE = \frac{1}{n}\sum_{i=1}^{n}|y_i - \hat{y}_i|$
  • R-squared ($R^2$): $R^2 = 1 - \frac{\sum_{i}(y_i - \hat{y}_i)^2}{\sum_{i}(y_i - \bar{y})^2}$

Matumizi ya nishati yalikadiriwa kulingana na muda wa mafunzo na vipimo vya vifaa (mfano, matumizi ya GPU).

4. Matokeo ya Majaribio

4.1 Uchambuzi wa Viashiria vya Utendaji

Muundo wa LSTM uliotengenezwa ulionyesha uwezo mzuri wa kutabiri mienendo ya EUR/USD. Miongoni mwa usanidi kadhaa uliojaribiwa, muundo uliofunzwa kwa zamu 90 ulitoa matokeo bora zaidi. Uchambuzi wa kulinganisha ulionyesha utendaji bora wa muundo wa LSTM dhidi ya miundo ya msingi ya utabiri (mfano, RNN rahisi, ARIMA), kama ilivyothibitishwa na thamani za chini za MSE na MAE na thamani ya R-squared iliyo karibu na 1, ikionyesha mfano unaolingana zaidi na data.

Muhtasari Mkuu wa Utendaji (Muundo Bora - Zamu 90)

MSE: Chini sana kuliko miundo ya msingi.

MAE: Inaonyesha utabiri thabiti na upungufu wa usikivu wa makosa makubwa.

R-squared: Thamani ilionyesha uwezo mkubwa wa maelezo wa muundo.

4.2 Uchambuzi wa Matumizi ya Nishati

Utafiti huu ulionyesha uhusiano usio wa mstari kati ya utata wa muundo (zamu, tabaka) na matumizi ya nishati. Muundo wa zamu 90 uliwakilisha "hatua bora," ukifikia usahihi wa juu bila gharama kubwa isiyolingana ya nishati inayohusishwa na mafunzo marefu zaidi. Hii inasisitiza umuhimu wa uboreshaji wa vigezo vya juu sio tu kwa usahihi, bali pia kwa ufanisi.

5. Majadiliano

Matokeo yanathibitisha ufanisi wa LSTM kwa utabiri wa Forex. Ujumuishaji wa matumizi ya nishati kama kipimo muhimu cha tathmini ni mchango wa kutabiri mbele. Hii inalinganisha uvumbuzi wa teknolojia ya kifedha (FinTech) na hitaji linalokua la kompyuta endelevu, wasiwasi ulioangaziwa na utafiti kutoka taasisi kama Taasisi ya Kitaifa ya Lawrence Berkeley kuhusu matumizi ya nishati ya vituo vya data.

6. Hitimisho na Kazi ya Baadaye

Utafiti huu umefanikiwa kutengeneza muundo wa LSTM kwa utabiri wa EUR/USD ambao unalinda usawa kati ya usahihi wa utabiri na ufanisi wa kompyuta. Unatoa mfumo wa kutathmini miundo ya AI katika fedha kupitia mtazamo wa pande mbili wa utendaji na uendelevu. Kazi ya baadaye inaweza kuchunguza miundo ya kisasa zaidi, yenye ufanisi wa asili kama vile miundo ya msingi wa Transformer au mbinu mseto, na kutumia uchambuzi wa kina zaidi wa nishati katika kiwango cha vifaa.

7. Uchambuzi wa Asili na Uchambuzi wa Mtaalamu

Uelewa wa Msingi: Thamani halisi ya karatasi hii sio tu onyesho lingine la LSTM-kwa-Forex; ni jaribio la mwanzo lakini muhimu la kuingiza uendelevu wa kompyuta katika fedha za kiasi. Wakati utafiti mwingi wa FinTech unafuata faida ndogo za usahihi kwa miundo mikubwa, Echrignui na Hamiche wanauliza swali sahihi: kwa gharama gani ya nishati? Mwelekeo wao wa kutafuta "hatua bora ya zamu 90" ni hatua ya kwanza ya vitendo kuelekea AI ya kijani katika nyanja za mzunguko wa juu.

Mtiririko wa Mantiki na Nguvu: Mbinu ni sahihi na inaweza kurudiwa. Kutumia viashiria vya kawaida (MSE, MAE, R²) kunaweka kazi hiyo katika mazoea yaliyokubalika. Uhusiano wazi kati ya uboreshaji wa muundo (uchaguzi wa zamu) na kupunguza nishati ndio nguvu kuu ya karatasi hii. Inalingana na mabadiliko makubwa yanayoonekana katika taswira ya kompyuta, ambapo kazi kama karatasi ya asili ya CycleGAN (Zhu et al., 2017) ilipendelea muundo mpya kuliko ufanisi, lakini utafiti unaofuata umelenga sana kuboresha mzigo wa kompyuta. Karatasi hii inatambua kwa usahihi kwamba katika soko la 24/5 kama Forex, wigo wa kaboni wa uendeshaji wa miundo ya utabiri inayoendelea kuendesha sio ndogo.

Kasoro na Pengo Muhimu: Uchambuzi ni wa juu tu. Kusema kwamba muundo wenye zamu 90 ni mzuri kwa nishati haina maana bila kiwango cha msingi. Kulinganisha na matumizi ya nishati ya muundo wa zamu 200 dhidi ya faida yake ya usahihi iko wapi? Kipimo cha nishati kinaonekana kimekadiriwa, sio kupimwa kwa majaribio kupitia zana kama CodeCarbon au vifaa vya kufuatilia nguvu vya vifaa—udhaifu mkubwa wa kimbinu. Zaidi ya hayo, maelezo ya muundo wa muundo ni machache. Je, mtandao rahisi wa GRU ungefikia usahihi sawa na matumizi ya chini ya ucheleweshaji na nishati? Mapitio ya fasihi, ingawa yanatosha, yanakosa majadiliano muhimu ya kisasa kuhusu Transformer zenye ufanisi (mfano, Linformers) ambazo zinaweza kuwa bora zaidi kwa mfululizo fulani wa kifedha.

Uelewa Unaoweza Kutekelezwa: Kwa watendaji, hitimisho ni kutaka uchambuzi wa nishati katika mchakato wako wa ukuzaji wa muundo. Usifuatilie tu hasara ya uthibitishaji; fuatilia joule kwa kila utabiri. Chunguza mbinu za ukandamizaji wa muundo (kukata, kupima) zinazotumika kwa kawaida katika AI ya rununu lakini hazitumiki vya kutosha katika fedha. Siku zijsi sio tu miundo sahihi; ni miundo sahihi, inayoweza kuelezewa, na yenye ufanisi. Shinikizo la udhibiti kwenye mambo ya ESG (Mazingira, Kijamii, na Utawala) hivi karibuni litapanuka hadi kwenye algoriti zinazowasha kampuni za uwekezaji. Karatasi hii, licha ya mapungufu yake, inaelekeza dira katika mwelekeo sahihi—kuelekea siku zijazo ambapo AI ya kifedha haipimwi tu katika sehemu za msingi za alfa bali pia katika gramu za CO₂ sawa zilizookolewa.

8. Mfumo wa Kiufundi na Mfano wa Kesi

Mfano wa Mfumo wa Uchambuzi (Sio Msimbo): Fikiria hazina ya uwekezaji inayotumia muundo wa LSTM kwa ishara za EUR/USD ndani ya siku. Njia ya kawaida ni kufundisha muundo mkubwa zaidi unaowezekana kwenye data mpya zaidi. Mfumo huu unapendekeza tathmini iliyopangwa:

  1. Awamu ya 1 - Kipimo cha Usahihi: Fundisha lahaja nyingi za muundo (kutofautisha tabaka, vitengo, zamu) na uanzishe kiwango cha msingi cha usahihi (mfano, uwiano wa Sharpe wa biashara zilizosimuliwa) kwa kila moja.
  2. Awamu ya 2 - Ukaguzi wa Ufanisi: Chunguza matumizi ya nishati ya mafunzo na utambuzi wa kila lahaja kwa kutumia maktaba maalum (mfano, `torch.profiler` na programu-jalizi za nishati) kwenye vifaa vya lengo vya utekelezaji.
  3. Awamu ya 3 - Uchambuzi wa Mipaka ya Pareto: Panga miundo kwenye grafu ya pande mbili na "Utendaji wa Utabiri" kwenye mhimili wa Y na "Nishati kwa kila Utambuzi" kwenye mhimili wa X. Muundo bora uko kwenye mpaka wa Pareto—unatoa utendaji bora zaidi kwa bajeti fulani ya nishati.
  4. Awamu ya 4 - Utekelezaji na Ufuatiliaji: Tekeleza muundo uliochaguliwa na ufuatilie wigo wake halisi wa nishati, ukiweka maonyo kwa mabadiliko katika viashiria vya utabiri au ufanisi.

Mfumo huu unahama mbali na "usahihi kwa gharama yoyote" hadi kwenye mkakati wa usawa, endelevu wa uendeshaji wa muundo (ModelOps).

9. Matumizi ya Baadaye na Mwelekeo

Kanuni zilizoelezewa zina matumizi mapana:

  • FinTech ya Kijani: Uundaji wa "alama za uendelevu" kwa algoriti za biashara, zinazoweza kuathiri ukadiriaji wa hazina na uchaguzi wa wawekezaji.
  • Kompyuta ya Ukingo kwa Fedha: Kubuni miundo nyepesi, yenye ufanisi inayoweza kuendeshwa kwenye vifaa vya ukingo karibu na seva za kubadilishana, kupunguza ucheleweshaji wa usafirishaji wa data na nishati.
  • Teknolojia ya Udhibiti (RegTech): AI yenye ufanisi wa nishati kwa ufuatiliaji wa mnyororo wa manunuzi na ugunduzi wa udanganyifu katika seti kubwa za data.
  • Uboreshaji wa Mwingiliano wa Mali: Kutumia miundo sawa ya LSTM au Transformer yenye ufanisi kutabiri mienendo inayohusiana katika bidhaa za nishati, fedha za kripto, na dhamana, kuwezesha mikakati ya jumla ya portfoli na wigo wa chini wa kaboni wa kompyuta.
  • Kujifunza kwa Shirikisho: Kufundisha miundo ya utabiri katika taasisi za kifedha zisizo na kituo kati bila kushiriki data ghafi, kuboresha faragha na kupunguza uwezekano wa gharama za nishati zinazohusishwa na kuweka data nyingi katikati.

10. Marejeo

  1. Hochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural computation, 9(8), 1735-1780.
  2. Zhu, J. Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired image-to-image translation using cycle-consistent adversarial networks. In Proceedings of the IEEE international conference on computer vision (pp. 2223-2232).
  3. Taasisi ya Kitaifa ya Lawrence Berkeley. (2023). Vituo vya Data na Matumizi ya Nishati. Imepatikana kutoka https://eta.lbl.gov/publications/united-states-data-center-energy
  4. Benki ya Makusanyo ya Kimataifa. (2019). Uchunguzi wa Benki Kuu ya Miaka Mitatu wa Soko la Kubadilishana Fedha za Kigeni na Soko la Juu ya Kukodisha (OTC) la Derivatives.
  5. Brown, T., et al. (2020). Language models are few-shot learners. Advances in neural information processing systems, 33, 1877-1901. (Kwa muktadha wa miundo ya Transformer).
  6. Strubell, E., Ganesh, A., & McCallum, A. (2019). Energy and policy considerations for deep learning in NLP. arXiv preprint arXiv:1906.02243.