1. ভূমিকা
মার্কিন ডলার থেকে বাংলাদেশী টাকা (USD/BDT) বিনিময় হারের সঠিক পূর্বাভাস বাংলাদেশের আমদানিনির্ভর অর্থনীতির জন্য অত্যন্ত গুরুত্বপূর্ণ, যা বাণিজ্য ভারসাম্য, মুদ্রাস্ফীতি এবং বৈদেশিক রিজার্ভ ব্যবস্থাপনাকে প্রভাবিত করে। ঐতিহ্যগত পরিসংখ্যানিক মডেলগুলি প্রায়শই উদীয়মান বাজার মুদ্রার অরৈখিক, জটিল ধরণগুলি, বিশেষ করে অর্থনৈতিক অনিশ্চয়তার অধীনে, ধরতে ব্যর্থ হয়। এই গবেষণাটি ২০১৮ থেকে ২০২৩ সালের ঐতিহাসিক তথ্য ব্যবহার করে, বিশেষত লং শর্ট-টার্ম মেমরি (LSTM) নিউরাল নেটওয়ার্ক এবং গ্রেডিয়েন্ট বুস্টিং ক্লাসিফায়ার (GBC) এর মতো উন্নত মেশিন লার্নিং মডেল তৈরি ও মূল্যায়নের মাধ্যমে এই শূন্যতা পূরণ করে। এই গবেষণার লক্ষ্য আর্থিক ঝুঁকি প্রশমন এবং নীতি প্রণয়নের জন্য শক্তিশালী সরঞ্জাম সরবরাহ করা।
2. সাহিত্য পর্যালোচনা
ডিপ লার্নিং, বিশেষ করে LSTM নেটওয়ার্কের প্রয়োগ, আর্থিক সময় সিরিজ পূর্বাভাসে উল্লেখযোগ্য প্রতিশ্রুতি দেখিয়েছে। RNN-এ ভ্যানিশিং গ্রেডিয়েন্ট সমস্যা সমাধানের জন্য Hochreiter & Schmidhuber দ্বারা প্রবর্তিত, LSTM দীর্ঘমেয়াদী নির্ভরতা ক্যাপচারে দক্ষ। ভুলে যাওয়ার গেট (Gers et al.) এর মতো পরবর্তী উন্নতিগুলি অস্থিরতার সাথে খাপ খাইয়ে নেওয়ার ক্ষমতা উন্নত করেছে। USD/INR-এর মতো অভিজ্ঞতামূলক গবেষণাগুলি দেখায় যে LSTM দিকনির্দেশক নির্ভুলতায় ঐতিহ্যগত ARIMA মডেলগুলিকে ১৮–২২% ছাড়িয়ে গেছে। তবে, বাংলাদেশের অনন্য পরিচালিত-ভাসমান ব্যবস্থা এবং স্থানীয় ম্যাক্রোইকোনমিক ধাক্কাগুলি বিবেচনায় নিয়ে বিশেষভাবে USD/BDT জুটিকে লক্ষ্য করে গবেষণা এখনও সীমিত। এই গবেষণাটি এই নবজাত ক্ষেত্রের উপর ভিত্তি করে এবং প্রসারিত করে।
3. পদ্ধতি ও তথ্য
3.1 তথ্য সংগ্রহ ও প্রাক-প্রক্রিয়াকরণ
জানুয়ারি ২০১৮ থেকে ডিসেম্বর ২০২৩ পর্যন্ত দৈনিক USD/BDT বিনিময় হার তথ্য Yahoo Finance থেকে সংগ্রহ করা হয়েছিল। ডেটাসেটটি পরিষ্কার করা হয়েছিল এবং বাজার প্রবণতা ও অস্থিরতা ক্যাপচার করার জন্য স্বাভাবিক দৈনিক রিটার্ন, সরল চলমান গড় (SMA) এবং আপেক্ষিক শক্তি সূচক (RSI) এর মতো বৈশিষ্ট্যগুলি তৈরি করা হয়েছিল। তথ্যগুলিকে প্রশিক্ষণ (৮০%) এবং পরীক্ষা (২০%) সেটে বিভক্ত করা হয়েছিল।
3.2 LSTM মডেল আর্কিটেকচার
মূল পূর্বাভাস মডেলটি একটি স্ট্যাকড LSTM নেটওয়ার্ক। আর্কিটেকচারে সাধারণত নিম্নলিখিতগুলি জড়িত:
- ইনপুট লেয়ার: ঐতিহাসিক মূল্য/বৈশিষ্ট্য তথ্যের ক্রম।
- LSTM লেয়ার: ওভারফিটিং প্রতিরোধের জন্য নিয়মিতকরণের জন্য ড্রপআউট সহ দুই বা ততোধিক স্তর।
- ডেনস লেয়ার: আউটপুটের জন্য একটি সম্পূর্ণরূপে সংযুক্ত স্তর।
- আউটপুট লেয়ার: পরবর্তী সময়ের বিনিময় হার পূর্বাভাসের জন্য একটি একক নিউরন।
মডেলটি Adam অপ্টিমাইজার এবং Mean Squared Error (MSE) কে লস ফাংশন হিসাবে ব্যবহার করে প্রশিক্ষিত হয়েছিল।
3.3 গ্রেডিয়েন্ট বুস্টিং ক্লাসিফায়ার
দিকনির্দেশক পূর্বাভাসের (উর্ধ্বগতি/নিম্নগতি) জন্য, একটি গ্রেডিয়েন্ট বুস্টিং ক্লাসিফায়ার (GBC) প্রয়োগ করা হয়েছিল। এটি একটি শক্তিশালী শ্রেণিবদ্ধকারী তৈরি করতে দুর্বল পূর্বাভাস মডেলগুলির (সিদ্ধান্ত গাছ) একটি সমষ্টি ব্যবহার করে, পুনরাবৃত্তিমূলক শেখার মাধ্যমে পূর্বাভাস ত্রুটি কমানোর উপর দৃষ্টি নিবদ্ধ করে।
LSTM নির্ভুলতা
৯৯.৪৪৯%
LSTM RMSE
০.৯৮৫৮
লাভজনক ট্রেডের হার (GBC)
৪০.৮২%
ARIMA RMSE (বেসলাইন)
১.৩৪২
4. পরীক্ষামূলক ফলাফল ও বিশ্লেষণ
4.1 কার্যকারিতা মেট্রিক্স
LSTM মডেলটি ব্যতিক্রমী ফলাফল অর্জন করেছে: ৯৯.৪৪৯% নির্ভুলতা, ০.৯৮৫৮ রুট মিন স্কোয়ার ত্রুটি (RMSE) এবং ০.৮৫২৩ পরীক্ষার ক্ষতি। এই কার্যকারিতা ঐতিহ্যগত ARIMA মডেলকে উল্লেখযোগ্যভাবে ছাড়িয়ে গেছে, যার RMSE ছিল ১.৩৪২। উচ্চ নির্ভুলতা USD/BDT বিনিময় হারের জটিল সময়গত গতিবিদ্যা মডেলিংয়ে LSTM-এর উচ্চতর ক্ষমতা নির্দেশ করে।
4.2 ব্যাকটেস্টিং ও ট্রেডিং সিমুলেশন
গ্রেডিয়েন্ট বুস্টিং ক্লাসিফায়ারকে $১০,০০০ প্রাথমিক মূলধন নিয়ে একটি ট্রেডিং সিমুলেশনে ব্যাকটেস্ট করা হয়েছিল। ৪৯টি ট্রেডের উপর, মডেলটি ৪০.৮২% লাভজনক ট্রেডের হার অর্জন করেছে। তবে, সিমুলেশনের ফলে $২০,৬৫৩.২৫ নেট ক্ষতি হয়েছে। এটি একটি গুরুত্বপূর্ণ অন্তর্দৃষ্টি তুলে ধরে: উচ্চ দিকনির্দেশক নির্ভুলতা স্বয়ংক্রিয়ভাবে লাভজনক ট্রেডিং কৌশলে রূপান্তরিত হয় না, কারণ লেনদেনের খরচ, স্লিপেজ এবং ঝুঁকি ব্যবস্থাপনা (PDF-এ উল্লেখ নেই এমন স্টপ-লস/টেক-প্রফিট স্তর) নির্ধারক ভূমিকা পালন করে।
চার্ট বর্ণনা (অন্তর্নিহিত): একটি লাইন চার্ট সম্ভবত ঐতিহাসিক USD/BDT হার প্রায় ০.০১২ (২০১৮) থেকে ০.০০৯ (২০২৩) এ নেমে যাওয়া দেখাবে। একটি দ্বিতীয় চার্ট GBC ট্রেডিং কৌশলের ক্রমবর্ধমান P&L প্লট করবে, যা লাভের প্রাথমিক সময়কাল দেখাবে যার পরে চূড়ান্ত নেট ক্ষতির দিকে নিয়ে যাওয়া একটি খাড়া ড্রডাউন হবে।
5. প্রযুক্তিগত গভীর অনুসন্ধান
LSTM-এর কার্যকারিতার মূলটি এর সেল স্টেট এবং গেটিং মেকানিজমে নিহিত। সময় ধাপ $t$ এ একটি LSTM সেলের জন্য মূল সমীকরণগুলি হল:
ভুলে যাওয়ার গেট: $f_t = \sigma(W_f \cdot [h_{t-1}, x_t] + b_f)$
ইনপুট গেট: $i_t = \sigma(W_i \cdot [h_{t-1}, x_t] + b_i)$
প্রার্থী সেল স্টেট: $\tilde{C}_t = \tanh(W_C \cdot [h_{t-1}, x_t] + b_C)$
সেল স্টেট আপডেট: $C_t = f_t * C_{t-1} + i_t * \tilde{C}_t$
আউটপুট গেট: $o_t = \sigma(W_o \cdot [h_{t-1}, x_t] + b_o)$
লুকানো অবস্থা আউটপুট: $h_t = o_t * \tanh(C_t)$
যেখানে $\sigma$ হল সিগময়েড ফাংশন, $*$ উপাদান-ভিত্তিক গুণন নির্দেশ করে, $W$ এবং $b$ ওজন এবং পক্ষপাত, $x_t$ হল ইনপুট, $h_t$ হল লুকানো অবস্থা, এবং $C_t$ হল সেল স্টেট। এই আর্কিটেকচার মডেলটিকে দীর্ঘ ক্রমের উপর তথ্য নির্বাচনীভাবে মনে রাখতে বা ভুলে যেতে দেয়, যা দীর্ঘ-পরিসরের নির্ভরতা সহ আর্থিক সময় সিরিজের জন্য অত্যন্ত গুরুত্বপূর্ণ।
6. বিশ্লেষণাত্মক কাঠামো ও উদাহরণ
কাঠামো: ফরেক্স ML পাইপলাইন
এই গবেষণাটি আর্থিক ML-এর জন্য একটি আদর্শ কিন্তু কার্যকর পাইপলাইনকে উদাহরণস্বরূপ উপস্থাপন করে:
- সমস্যা ফ্রেমিং: রিগ্রেশন (মূল্যের জন্য LSTM) বনাম শ্রেণিবিন্যাস (দিকের জন্য GBC)।
- বৈশিষ্ট্য প্রকৌশল: কাঁচা মূল্য থেকে পূর্বাভাসমূলক সংকেত তৈরি করা (রিটার্ন, প্রযুক্তিগত সূচক)।
- মডেল নির্বাচন ও প্রশিক্ষণ: সময়গত তথ্যের জন্য ক্রম-সচেতন মডেল (LSTM) নির্বাচন করা।
- কঠোর বৈধতা: সামনের দিকে তাকিয়ে থাকা পক্ষপাত এড়াতে এলোমেলো বিভাজন নয়, সময়-সিরিজ ক্রস-ভ্যালিডেশন ব্যবহার করা।
- কৌশল ব্যাকটেস্টিং: বাস্তবসম্মত সীমাবদ্ধতা সহ একটি সিমুলেটেড ট্রেডিং কৌশলে মডেল পূর্বাভাস অনুবাদ করা।
উদাহরণ: সংকেত উৎপাদন
LSTM পূর্বাভাসের উপর ভিত্তি করে একটি সরলীকৃত নিয়ম হতে পারে: "যদি আগামীকালের পূর্বাভাসিত মূল্য > (আজকের মূল্য + একটি থ্রেশহোল্ড $\alpha$), একটি BUY সংকেত তৈরি করুন।" GBC সরাসরি একটি শ্রেণি লেবেল আউটপুট করে (UP-এর জন্য 1, DOWN-এর জন্য 0)। গবেষণাপত্রের ট্রেডিং ক্ষতি থেকে গুরুত্বপূর্ণ শিক্ষা হল একটি পরবর্তী ঝুঁকি ব্যবস্থাপনা স্তর এর প্রয়োজনীয়তা যা অবস্থানের আকার, স্টপ-লস অর্ডার এবং পোর্টফোলিও বরাদ্দ নির্ধারণ করে, যা সম্ভবত সিমুলেশনে অনুপস্থিত বা সরল ছিল।
7. ভবিষ্যত প্রয়োগ ও দিকনির্দেশনা
ফরেক্স পূর্বাভাসে AI-এর ভবিষ্যত বহু-মোডাল, অভিযোজিত সিস্টেমে নিহিত:
- বিকল্প তথ্যের একীকরণ: রিয়েল-টাইম সংবাদ সেন্টিমেন্ট বিশ্লেষণ (BERT-এর মতো NLP মডেল ব্যবহার করে), কেন্দ্রীয় ব্যাংকের যোগাযোগের সুর এবং ভূ-রাজনৈতিক ঝুঁকি সূচক অন্তর্ভুক্ত করা, যেমন Two Sigma-এর মতো হেজ ফান্ডে দেখা যায়।
- হাইব্রিড ও অ্যাটেনশন-ভিত্তিক মডেল: স্ট্যান্ডার্ড LSTM-এর বাইরে সেলফ-অ্যাটেনশন মেকানিজম সহ ট্রান্সফরমার আর্কিটেকচারে যাওয়া (যেমন Vaswani et al.-এর "Attention is All You Need"-এ রয়েছে) যা বিভিন্ন সময় ধাপের গুরুত্ব আরও নমনীয়ভাবে ওজন করতে পারে।
- রিইনফোর্সমেন্ট লার্নিং (RL): RL এজেন্ট তৈরি করা যা খরচ এবং ঝুঁকি-সমন্বিত রিটার্ন বিবেচনা করে সরাসরি সর্বোত্তম ট্রেডিং নীতি শেখে, শুধুমাত্র মূল্য পূর্বাভাস দেওয়ার পরিবর্তে। এটি DeepMind এবং OpenAI-এর গবেষণার সাথে সামঞ্জস্যপূর্ণ।
- ব্যাখ্যাযোগ্য AI (XAI): SHAP বা LIME-এর মতো কৌশল প্রয়োগ করা মডেল পূর্বাভাস ব্যাখ্যা করার জন্য, যা নিয়ন্ত্রক সম্মতি এবং আর্থিক প্রতিষ্ঠান থেকে আস্থা অর্জনের জন্য অত্যন্ত গুরুত্বপূর্ণ।
- ক্রস-মার্কেট লার্নিং: একাধিক মুদ্রা জোড়া বা সম্পদ শ্রেণীতে মডেল প্রশিক্ষণ দেওয়া অস্থিরতা এবং সংক্রমণের সার্বজনীন ধরণ শেখার জন্য।
8. তথ্যসূত্র
- Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. Neural Computation.
- Gers, F. A., Schmidhuber, J., & Cummins, F. (2000). Learning to Forget: Continual Prediction with LSTM.
- Rahman et al. (2022). LSTM-based Forecasting for Emerging Market Currencies: A USD/INR Case Study. Journal of Computational Finance.
- Afrin, S., et al. (2021). Forecasting USD/BDT Exchange Rate Using Machine Learning. International Conference on Computer and Information Technology.
- Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems.
- Yahoo Finance. (2023). USD/BDT Historical Data.
9. শিল্প বিশ্লেষকের দৃষ্টিভঙ্গি
মূল অন্তর্দৃষ্টি: এই গবেষণাপত্রটি কোয়ান্টিটেটিভ ফাইন্যান্সে "নির্ভুলতা-লাভজনকতা প্যারাডক্স" এর একটি ক্লাসিক উদাহরণ। লেখকরা একটি প্রযুক্তিগতভাবে সঠিক LSTM মডেল তৈরি করেছেন যা USD/BDT পূর্বাভাসে প্রায় নিখুঁত ৯৯.৪৫% নির্ভুলতা অর্জন করেছে—একটি প্রশংসনীয় কৃতিত্ব—তবুও তাদের সংশ্লিষ্ট ট্রেডিং কৌশলটি বিপর্যয়করভাবে মূলধন হারিয়েছে। আসল গল্পটি মডেলের নির্ভুলতা নয়; এটি একাডেমিক মেট্রিক অপ্টিমাইজেশন এবং বাস্তব-বিশ্বের ট্রেডিং P&L-এর মধ্যে বিদ্যমান বিচ্ছিন্নতা। এটি অনেক কোয়ান্টদের জন্য একটি কঠিন সত্যকে তুলে ধরে: RMSE কমানো Sharpe Ratio সর্বাধিক করার মতো নয়।
যুক্তিগত প্রবাহ: গবেষণাটি একটি আদর্শ পাইপলাইন অনুসরণ করে: তথ্য সংগ্রহ, বৈশিষ্ট্য প্রকৌশল, মডেল নির্বাচন (LSTM/GBC), এবং কার্যকারিতা বৈধতা। যাইহোক, যৌক্তিক ত্রুটিটি বৈধতা থেকে প্রয়োগে লাফ দেওয়ার মধ্যে রয়েছে। ব্যাকটেস্টিংটি সরল মনে হয়, সম্ভবত শক্তিশালী লেনদেন খরচ মডেলিং, স্লিপেজ এবং, সবচেয়ে গুরুত্বপূর্ণভাবে, একটি সুসংগত ঝুঁকি ব্যবস্থাপনা কাঠামোর অভাব রয়েছে। একটি বড় নেতিবাচক নেট ফলাফল সহ ৪০% জয়ের হার ইঙ্গিত দেয় যে কৌশলটির হারানো ট্রেড প্রতি ক্ষতি জয়ী ট্রেড প্রতি লাভের চেয়ে অনেক বেশি ছিল—একটি মারাত্মক ত্রুটি যা কোন পরিমাণ LSTM নির্ভুলতা ঠিক করতে পারে না।
শক্তি ও ত্রুটি:
- শক্তি: একটি বিশেষ, কম গবেষিত মুদ্রা জোড়া (USD/BDT) এর জন্য চমৎকার মডেল প্রকৌশল। ARIMA-এর সাথে তুলনা একটি স্পষ্ট বেঞ্চমার্ক প্রদান করে। ট্রেডিং ক্ষতির স্পষ্ট উল্লেখ বুদ্ধিবৃত্তিকভাবে সৎ এবং অনেক গবেষণাপত্রের চেয়ে বেশি মূল্যবান যা শুধুমাত্র সাফল্যগুলি তুলে ধরে।
- ত্রুটি: ট্রেডিং সিমুলেশন মূলত একটি পরবর্তী চিন্তা, যা পূর্বাভাস এবং নির্বাহ স্তরের মধ্যে একীকরণের অভাব প্রকাশ করে—যা সিস্টেমেটিক ট্রেডিংয়ের হৃদয়। অবস্থানের আকার (যেমন, Kelly Criterion), স্টপ-লস, বা পোর্টফোলিও প্রসঙ্গের কোন আলোচনা নেই। তদুপরি, যদিও LSTM শক্তিশালী, তাদের ব্ল্যাক-বক্স প্রকৃতি গ্রেডিয়েন্ট বুস্টেড ট্রি-এর মতো আরও ব্যাখ্যাযোগ্য সমষ্টির তুলনায় নিয়ন্ত্রিত আর্থিক প্রতিষ্ঠানে গ্রহণের একটি উল্লেখযোগ্য বাধা হিসাবে রয়ে গেছে।
কার্যকরী অন্তর্দৃষ্টি:
- রিইনফোর্সমেন্ট লার্নিং দিয়ে ব্যবধান পূরণ: পূর্বাভাস এবং ট্রেডিংকে পৃথক ধাপ হিসাবে বিবেচনা করার পরিবর্তে, ভবিষ্যতের কাজে এন্ড-টু-এন্ড রিইনফোর্সমেন্ট লার্নিং (RL) ব্যবহার করা উচিত। একটি RL এজেন্ট, DeepMind দ্বারা গেম খেলার জন্য ব্যবহৃতগুলির মতো, কাঁচা তথ্য থেকে সরাসরি ট্রেডিং মেট্রিক্স (যেমন, ক্রমবর্ধমান রিটার্ন, Sortino অনুপাত) অপ্টিমাইজ করতে শিখতে পারে, স্বাভাবিকভাবেই খরচ এবং ঝুঁকি বিবেচনা করে।
- "পূর্বাভাস-নির্বাহ-ঝুঁকি" ত্রয়ী গ্রহণ: যেকোন পূর্বাভাস গবেষণা একটি ত্রয়ীর মধ্যে মূল্যায়ন করা আবশ্যক। পূর্বাভাস মডেলটি শুধুমাত্র একটি শীর্ষবিন্দু। সমান কঠোরতা নির্বাহ মডেল (বাজার প্রভাব, খরচ) এবং ঝুঁকি মডেল (VaR, প্রত্যাশিত শর্টফল, ড্রডাউন নিয়ন্ত্রণ) এর উপর প্রয়োগ করা আবশ্যক।
- শাসন শনাক্তকরণে ফোকাস: পরিচালিত ভাসমানের অধীনে USD/BDT-এর স্বতন্ত্র শাসন রয়েছে (স্থিতিশীল, হস্তক্ষেপ, সংকট)। Markov Switching Models বা ক্লাস্টারিং অ্যালগরিদমের মতো মডেলগুলি প্রথমে বর্তমান শাসন শনাক্ত করতে ব্যবহার করা উচিত, তারপর সবচেয়ে উপযুক্ত পূর্বাভাস মডেল প্রয়োগ করা উচিত। একটি মডেল-সব-ফিট-অল পদ্ধতি স্বল্পদৃষ্টি।
- ব্যাখ্যাযোগ্যতা অগ্রাধিকার দিন: একাডেমিক অনুশীলন থেকে ট্রেডারের সরঞ্জামে যাওয়ার জন্য, XAI কৌশল প্রয়োগ করুন। একজন ট্রেডারকে দেখানো যে একটি "বিক্রয়" সংকেত ৬০% প্রসারিত বাণিজ্য ঘাটতি এবং ৪০% RDI ডাইভারজেন্স দ্বারা চালিত, একটি ৯৯% নির্ভুল ব্ল্যাক বক্সের চেয়ে অনেক বেশি আস্থা তৈরি করে।