انتخاب زبان

پیش‌بینی نرخ ارز دلار به تاکا بنگلادش با استفاده از LSTM و یادگیری ماشین

مطالعه‌ای در مورد استفاده از شبکه‌های عصبی LSTM و تقویت گرادیان برای پیش‌بینی دقیق نرخ ارز دلار به تاکا بنگلادش، تحلیل عملکرد و پیامدهای عملی معاملاتی.
computecurrency.net | PDF Size: 0.4 MB
امتیاز: 4.5/5
امتیاز شما
شما قبلاً به این سند امتیاز داده اید
جلد سند PDF - پیش‌بینی نرخ ارز دلار به تاکا بنگلادش با استفاده از LSTM و یادگیری ماشین

1. مقدمه

پیش‌بینی دقیق نرخ ارز دلار آمریکا به تاکا بنگلادش (USD/BDT) برای اقتصاد واردات‌محور بنگلادش حیاتی است و بر تراز تجاری، تورم و مدیریت ذخایر ارزی تأثیر می‌گذارد. مدل‌های آماری سنتی اغلب در شناسایی الگوهای غیرخطی و پیچیده‌ای که مشخصه ارزهای بازارهای نوظهور است، به ویژه در شرایط عدم قطعیت اقتصادی، ناتوان هستند. این مطالعه با توسعه و ارزیابی مدل‌های پیشرفته یادگیری ماشین، به‌طور خاص شبکه‌های عصبی حافظه کوتاه‌مدت بلندمدت (LSTM) و طبقه‌بندهای تقویت گرادیان (GBC) با استفاده از داده‌های تاریخی از سال ۲۰۱۸ تا ۲۰۲۳، این شکاف را برطرف می‌کند. هدف این پژوهش ارائه ابزارهای قدرتمندی برای کاهش ریسک مالی و تدوین سیاست است.

2. مرور ادبیات

کاربرد یادگیری عمیق، به ویژه شبکه‌های LSTM، در پیش‌بینی سری‌های زمانی مالی نویدبخش بوده است. LSTM که توسط هوکرایتر و اشمیدهوبر برای حل مشکل محو شدن گرادیان در شبکه‌های عصبی بازگشتی (RNN) ابداع شد، در شناسایی وابستگی‌های بلندمدت عالی عمل می‌کند. بهبودهای بعدی مانند دروازه فراموشی (گِرس و همکاران) انطباق‌پذیری آن با نوسانات را افزایش داد. مطالعات تجربی، مانند مطالعات انجام‌شده بر روی جفت ارز USD/INR، نشان می‌دهد که LSTM در دقت جهت‌گیری ۱۸ تا ۲۲ درصد از مدل‌های سنتی ARIMA بهتر عمل می‌کند. با این حال، پژوهش‌های خاص متمرکز بر جفت ارز USD/BDT، با در نظر گرفتن رژیم شناور مدیریت‌شده منحصربه‌فرد بنگلادش و شوک‌های کلان اقتصادی محلی، همچنان محدود است. این مطالعه بر این حوزه نوپا بنا شده و آن را گسترش می‌دهد.

3. روش‌شناسی و داده‌ها

3.1 جمع‌آوری و پیش‌پردازش داده‌ها

داده‌های روزانه نرخ ارز USD/BDT از ژانویه ۲۰۱۸ تا دسامبر ۲۰۲۳ از یاهو فایننس استخراج شد. مجموعه داده پاکسازی شد و ویژگی‌هایی مانند بازده روزانه نرمال‌شده، میانگین متحرک ساده (SMA) و شاخص قدرت نسبی (RSI) برای شناسایی روندهای بازار و نوسانات مهندسی شد. داده‌ها به مجموعه‌های آموزش (۸۰٪) و آزمون (۲۰٪) تقسیم شدند.

3.2 معماری مدل LSTM

مدل اصلی پیش‌بینی، یک شبکه LSTM چندلایه است. معماری آن به‌طور معمول شامل موارد زیر است:

  • لایه ورودی: دنباله‌ای از داده‌های تاریخی قیمت/ویژگی.
  • لایه‌های LSTM: دو یا چند لایه با دراپ‌اوت برای تنظیم‌سازی و جلوگیری از بیش‌برازش.
  • لایه متراکم: یک لایه کاملاً متصل برای خروجی.
  • لایه خروجی: یک نورون منفرد برای پیش‌بینی نرخ ارز دوره بعد.

مدل با استفاده از بهینه‌ساز آدام و تابع زیان میانگین مربعات خطا (MSE) آموزش داده شد.

3.3 طبقه‌بند تقویت گرادیان

برای پیش‌بینی جهت‌گیری (حرکت صعودی/نزولی)، یک طبقه‌بند تقویت گرادیان (GBC) پیاده‌سازی شد. این مدل از مجموعه‌ای از مدل‌های پیش‌بینی ضعیف (درخت‌های تصمیم) برای ایجاد یک طبقه‌بند قوی استفاده می‌کند و بر کاهش خطای پیش‌بینی از طریق یادگیری تکراری تمرکز دارد.

دقت LSTM

۹۹.۴۴۹٪

ریشه میانگین مربعات خطای LSTM

۰.۹۸۵۸

نرخ معاملات سودده (GBC)

۴۰.۸۲٪

ریشه میانگین مربعات خطای ARIMA (خط پایه)

۱.۳۴۲

4. نتایج تجربی و تحلیل

4.1 معیارهای عملکرد

مدل LSTM به نتایج استثنایی دست یافت: دقت ۹۹.۴۴۹٪، ریشه میانگین مربعات خطا (RMSE) برابر با ۰.۹۸۵۸ و زیان آزمون ۰.۸۵۲۳. این عملکرد به‌طور قابل‌توجهی از مدل سنتی ARIMA که RMSE آن ۱.۳۴۲ بود، بهتر عمل کرد. دقت بالا نشان‌دهنده توانایی برتر LSTM در مدل‌سازی پویایی‌های زمانی پیچیده نرخ ارز USD/BDT است.

4.2 آزمون گذشته‌نگر و شبیه‌سازی معاملات

طبقه‌بند تقویت گرادیان در یک شبیه‌سازی معاملاتی با سرمایه اولیه ۱۰,۰۰۰ دلار مورد آزمون گذشته‌نگر قرار گرفت. در طول ۴۹ معامله، مدل به نرخ معاملات سودده ۴۰.۸۲٪ دست یافت. با این حال، شبیه‌سازی منجر به زیان خالص ۲۰,۶۵۳.۲۵ دلاری شد. این امر بینش مهمی را برجسته می‌کند: دقت جهت‌گیری بالا به‌طور خودکار به استراتژی‌های معاملاتی سودآور تبدیل نمی‌شود، زیرا هزینه‌های معاملاتی، لغزش قیمت و مدیریت ریسک (سطوح حد ضرر/حد سود که در PDF ذکر نشده) نقش تعیین‌کننده‌ای ایفا می‌کنند.

توضیح نمودار (ضمنی): یک نمودار خطی به احتمال زیاد نرخ تاریخی USD/BDT را نشان می‌دهد که از حدود ۰.۰۱۲ (۲۰۱۸) به ۰.۰۰۹ (۲۰۲۳) کاهش یافته است. یک نمودار دوم سود و زیان انباشته استراتژی معاملاتی GBC را ترسیم می‌کند که دوره اولیه سود را نشان می‌دهد و پس از آن یک افت شدید منجر به زیان خالص نهایی می‌شود.

5. بررسی فنی عمیق

هسته اثربخشی LSTM در حالت سلولی و مکانیسم‌های دروازه‌ای آن نهفته است. معادلات کلیدی برای یک سلول LSTM در گام زمانی $t$ عبارتند از:

دروازه فراموشی: $f_t = \sigma(W_f \cdot [h_{t-1}, x_t] + b_f)$
دروازه ورودی: $i_t = \sigma(W_i \cdot [h_{t-1}, x_t] + b_i)$
حالت سلولی کاندید: $\tilde{C}_t = \tanh(W_C \cdot [h_{t-1}, x_t] + b_C)$
به‌روزرسانی حالت سلولی: $C_t = f_t * C_{t-1} + i_t * \tilde{C}_t$
دروازه خروجی: $o_t = \sigma(W_o \cdot [h_{t-1}, x_t] + b_o)$
خروجی حالت پنهان: $h_t = o_t * \tanh(C_t)$

که در آن $\sigma$ تابع سیگموئید است، $*$ نشان‌دهنده ضرب درایه‌به‌درایه است، $W$ و $b$ وزن‌ها و بایاس‌ها هستند، $x_t$ ورودی، $h_t$ حالت پنهان و $C_t$ حالت سلولی است. این معماری به مدل اجازه می‌دهد تا به‌طور انتخابی اطلاعات را در طول دنباله‌های بلند به خاطر بسپارد یا فراموش کند، که برای سری‌های زمانی مالی با وابستگی‌های بلندمدت بسیار حیاتی است.

6. چارچوب تحلیلی و مثال موردی

چارچوب: خط لوله یادگیری ماشین بازار ارز
این مطالعه نمونه‌ای از یک خط لوله استاندارد و در عین حال مؤثر برای یادگیری ماشین مالی است:

  1. قالب‌بندی مسئله: رگرسیون (LSTM برای قیمت) در مقابل طبقه‌بندی (GBC برای جهت).
  2. مهندسی ویژگی: ایجاد سیگنال‌های پیش‌بینی از قیمت‌های خام (بازده، اندیکاتورهای فنی).
  3. انتخاب و آموزش مدل: انتخاب مدل‌های آگاه از توالی (LSTM) برای داده‌های زمانی.
  4. اعتبارسنجی دقیق: استفاده از اعتبارسنجی متقاطع سری زمانی، نه تقسیم‌های تصادفی، برای جلوگیری از سوگیری نگاه به آینده.
  5. آزمون گذشته‌نگر استراتژی: تبدیل پیش‌بینی‌های مدل به یک استراتژی معاملاتی شبیه‌سازی‌شده با محدودیت‌های واقع‌بینانه.

مثال موردی: تولید سیگنال
یک قانون ساده‌شده بر اساس پیش‌بینی LSTM می‌تواند این باشد: «اگر قیمت پیش‌بینی‌شده برای فردا > (قیمت امروز + آستانه $\alpha$) باشد، یک سیگنال خرید تولید کن.» GBC مستقیماً یک برچسب کلاس (۱ برای صعود، ۰ برای نزول) خروجی می‌دهد. درس حیاتی از زیان معاملاتی مقاله، ضرورت وجود یک لایه مدیریت ریسک بعدی است که اندازه موقعیت، دستورات حد ضرر و تخصیص پرتفوی را تعیین می‌کند، که به احتمال زیاد در شبیه‌سازی وجود نداشته یا بسیار ساده بوده است.

7. کاربردها و جهت‌های آینده

آینده هوش مصنوعی در پیش‌بینی بازار ارز در سیستم‌های چندوجهی و انطباق‌پذیر نهفته است:

  • ادغام داده‌های جایگزین: گنجاندن تحلیل احساسات اخبار بلادرنگ (با استفاده از مدل‌های پردازش زبان طبیعی مانند BERT)، لحن ارتباطات بانک مرکزی و شاخص‌های ریسک ژئوپلیتیکی، همان‌طور که در صندوق‌های پوشش ریسکی مانند Two Sigma مشاهده می‌شود.
  • مدل‌های ترکیبی و مبتنی بر توجه: فراتر رفتن از LSTM استاندارد به معماری‌های ترنسفورمر با مکانیسم‌های توجه خودی (مانند مدل ارائه‌شده توسط واسوانی و همکاران در مقاله «توجه تنها چیزی است که نیاز دارید») که می‌توانند اهمیت گام‌های زمانی مختلف را به‌طور انعطاف‌پذیر‌تری وزن‌دهی کنند.
  • یادگیری تقویتی (RL): توسعه عامل‌های RL که مستقیماً سیاست‌های معاملاتی بهینه را با در نظر گرفتن هزینه‌ها و بازده تعدیل‌شده با ریسک یاد می‌گیرند، نه صرفاً پیش‌بینی قیمت‌ها. این امر با پژوهش‌های دیپ‌مایند و OpenAI در محیط‌های شبیه‌سازی‌شده همسو است.
  • هوش مصنوعی قابل تفسیر (XAI): پیاده‌سازی تکنیک‌هایی مانند SHAP یا LIME برای تفسیر پیش‌بینی‌های مدل، که برای رعایت مقررات و جلب اعتماد مؤسسات مالی بسیار حیاتی است.
  • یادگیری بین‌بازاری: آموزش مدل‌ها بر روی چندین جفت ارز یا کلاس دارایی برای یادگیری الگوهای جهانی نوسان و سرایت.

8. منابع

  1. Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. Neural Computation.
  2. Gers, F. A., Schmidhuber, J., & Cummins, F. (2000). Learning to Forget: Continual Prediction with LSTM.
  3. Rahman et al. (2022). LSTM-based Forecasting for Emerging Market Currencies: A USD/INR Case Study. Journal of Computational Finance.
  4. Afrin, S., et al. (2021). Forecasting USD/BDT Exchange Rate Using Machine Learning. International Conference on Computer and Information Technology.
  5. Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems.
  6. Yahoo Finance. (2023). USD/BDT Historical Data.

9. دیدگاه تحلیلگر صنعت

بینش اصلی: این مقاله نمونه کلاسیکی از «پارادوکس دقت-سودآوری» در مالی کمّی است. نویسندگان یک مدل LSTM از نظر فنی صحیح ساخته‌اند که به دقت نزدیک به کامل ۹۹.۴۵٪ در پیش‌بینی USD/BDT دست یافته است - دستاوردی قابل تقدیر - با این حال استراتژی معاملاتی مرتبط آن به‌طور فاجعه‌باری سرمایه را از دست داده است. داستان واقعی دقت مدل نیست؛ بلکه شکاف آشکار بین بهینه‌سازی معیارهای آکادمیک و سود و زیان معاملاتی دنیای واقعی است. این امر حقیقتی را تأکید می‌کند که بسیاری از کمّی‌ها به سختی می‌آموزند: کمینه کردن RMSE با بیشینه کردن نسبت شارپ یکسان نیست.

جریان منطقی: این پژوهش از یک خط لوله استاندارد پیروی می‌کند: کسب داده، مهندسی ویژگی، انتخاب مدل (LSTM/GBC) و اعتبارسنجی عملکرد. با این حال، نقص منطقی در جهش از اعتبارسنجی به کاربرد است. آزمون گذشته‌نگر به نظر ساده‌لوحانه می‌رسد، به احتمال زیاد فاقد مدل‌سازی قوی هزینه‌های معاملاتی، لغزش قیمت و مهم‌تر از همه، یک چارچوب منسجم مدیریت ریسک است. نرخ برد ۴۰٪ با نتیجه خالص منفی بزرگ نشان می‌دهد که زیان‌های این استراتژی به ازای هر معامله بازنده بسیار بیشتر از سود هر معامله برنده بوده است - یک نقص مهلک که هیچ مقدار دقت LSTM نمی‌تواند آن را برطرف کند.

نقاط قوت و ضعف:

  • نقاط قوت: مهندسی مدل عالی برای یک جفت ارز خاص و کم‌تحقیق (USD/BDT). مقایسه با ARIMA یک معیار روشن ارائه می‌دهد. ذکر صریح زیان معاملاتی از نظر فکری صادقانه است و از بسیاری مقالاتی که فقط موفقیت‌ها را برجسته می‌کنند، ارزشمندتر است.
  • نقاط ضعف: شبیه‌سازی معاملاتی اساساً یک فکر بعدی است و نشان‌دهنده عدم یکپارچگی بین لایه پیش‌بینی و اجرا - که قلب معاملات سیستماتیک است - می‌باشد. هیچ بحثی در مورد اندازه موقعیت (مانند معیار کلی)، حد ضرر یا زمینه پرتفوی وجود ندارد. علاوه بر این، در حالی که LSTM قدرتمند است، ماهیت جعبه سیاه آن در مقایسه با مجموعه‌های قابل تفسیرتر مانند درخت‌های تقویت‌شده با گرادیان، همچنان مانع عمده‌ای برای پذیرش در مؤسسات مالی تحت نظارت محسوب می‌شود.

بینش‌های عملی:

  1. پل زدن بر شکاف با یادگیری تقویتی: به جای برخورد با پیش‌بینی و معامله به عنوان مراحل جداگانه، کار آینده باید از یادگیری تقویتی سرتاسری استفاده کند. یک عامل RL، مشابه آن‌چه دیپ‌مایند برای بازی‌ها استفاده می‌کند، می‌تواند یاد بگیرد که معیارهای معاملاتی مستقیم (مانند بازده انباشته، نسبت سورتینو) را از داده‌های خام بهینه کند و به‌طور ذاتی هزینه‌ها و ریسک را در نظر بگیرد.
  2. اتخاذ سه‌گانه «پیش‌بینی-اجرا-ریسک»: هر پژوهش پیش‌بینی باید در یک سه‌گانه ارزیابی شود. مدل پیش‌بینی تنها یک رأس است. باید همان دقت به مدل اجرا (تأثیر بازار، هزینه‌ها) و مدل ریسک (VaR، زیان مورد انتظار، کنترل افت سرمایه) اعمال شود.
  3. تمرکز بر تشخیص رژیم: USD/BDT، تحت یک شناور مدیریت‌شده، رژیم‌های متمایزی دارد (پایدار، مداخله، بحران). مدل‌هایی مانند مدل‌های تغییر مارکوف یا الگوریتم‌های خوشه‌بندی باید ابتدا برای تشخیص رژیم فعلی استفاده شوند، سپس مناسب‌ترین مدل پیش‌بینی اعمال شود. رویکرد یک مدل برای همه، کوته‌بینانه است.
  4. اولویت دادن به قابلیت تفسیر: برای حرکت از تمرین آکادمیک به ابزار معامله‌گر، تکنیک‌های XAI را پیاده‌سازی کنید. نشان دادن به یک معامله‌گر که یک سیگنال «فروش» ۶۰٪ توسط افزایش کسری تجاری و ۴۰٪ توسط واگرایی RSI هدایت می‌شود، اعتماد بسیار بیشتری نسبت به یک جعبه سیاه ۹۹٪ دقیق ایجاد می‌کند.
در خلاصه، این مقاله گامی محکم در کاربرد یادگیری عمیق در بازارهای مرزی است. با این حال، مهم‌ترین سهم آن، برجسته کردن ناخواسته شکاف بین یک پیش‌بینی عالی و یک معامله عالی است. پیشرفت بعدی از یک LSTM کمی بهتر حاصل نخواهد شد، بلکه از یک سیستم هوش مصنوعی جامع ناشی می‌شود که درک می‌کند مالی درباره مدیریت عدم قطعیت و ریسک است، نه فقط پیش‌بینی اعداد.