1. مقدمه
بازار ارز خارجی (فارکس) بزرگترین بازار مالی جهان است که با نقدینگی بالا، نوسان و پیچیدگی شناخته میشود. پیشبینی حرکات قیمت فارکس به دلیل تأثیر عوامل کلان اقتصادی متعدد، رویدادهای ژئوپلیتیک و احساسات بازار، بهطور مشهوری دشوار است. تحلیل تکنیکال سنتی، اگرچه مفید است، اغلب در تطبیق با تغییرات ناگهانی بازار یا رویدادهای "قوی سیاه" ناتوان است. این مقاله یک رویکرد نوین یادگیری ماشین را پیشنهاد میکند که تکنیکهای خوشهبندی را با مکانیزمهای توجه ترکیب میکند تا دقت پیشبینی را بهبود بخشد و بهطور خاص شرایط بازار فروششده را برای استراتژیهای معاملاتی رویداد-محور هدف قرار میدهد. این مدل از دادههای تاریخی فارکس و اندیکاتورهای تکنیکال استخراجشده از سال ۲۰۰۵ تا ۲۰۲۱ استفاده میکند.
2. ادبیات مرتبط
این پژوهش بر پایهی نظریه مالی تثبیتشده و کاربردهای یادگیری ماشین در امور مالی کمی بنا شده است.
2.1 اندیکاتورهای تکنیکال
اندیکاتورهای تکنیکال محاسبات ریاضی مبتنی بر قیمت تاریخی، حجم یا موقعیتهای باز هستند که برای پیشبینی جهت بازارهای مالی استفاده میشوند. این مدل چندین اندیکاتور کلیدی را دربرمیگیرد.
2.1.1 شاخص قدرت نسبی (RSI)
RSI یک نوسانساز مومنتوم است که سرعت و تغییر حرکات قیمت را اندازهگیری میکند. از آن برای شناسایی شرایط خرید افراطی یا فروش افراطی استفاده میشود.
فرمول: $RSI = 100 - \frac{100}{1 + RS}$ که در آن $RS = \frac{\text{میانگین سود در N دوره}}{\text{میانگین زیان در N دوره}}$.
مقدار RSI زیر ۳۰ معمولاً نشاندهندهی شرایط فروش افراطی (فرصت بالقوه خرید) است، در حالی که RSI بالای ۷۰ شرایط خرید افراطی (فرصت بالقوه فروش) را نشان میدهد.
2.1.2 میانگین متحرک ساده (SMA)، میانگین متحرک نمایی (EMA)، MACD
SMA میانگین بدون وزن N نقطه داده قبلی است. EMA وزن بیشتری به قیمتهای اخیر میدهد. واگرایی همگرایی میانگین متحرک (MACD) یک اندیکاتور مومنتوم دنبالکننده روند است.
فرمول: $MACD = EMA(\text{12 دوره}) - EMA(\text{26 دوره})$.
از یک خط سیگنال (EMA 9 روزه MACD) برای تولید سیگنالهای معاملاتی استفاده میشود. تقاطعهای بین MACD و خط سیگنال نشاندهنده روندهای بالقوه صعودی یا نزولی است.
2.1.3 باندهای بولینگر
باندهای بولینگر شامل یک خط SMA میانی با دو باند بیرونی است که در سطوح انحراف معیار (معمولاً ۲) ترسیم شدهاند. آنها نوسان بازار را اندازهگیری میکنند. فشردگی (باریک شدن باندها) اغلب مقدمهای برای دورهای از نوسان بالا است، در حالی که حرکت قیمت خارج از باندها ممکن است نشاندهنده ادامه یا بازگشت روند باشد.
3. بینش اصلی و جریان منطقی
بینش اصلی: شرط اساسی مقاله این است که مدلهای سری زمانی خالص قیمت/اندیکاتور، دید کوتاهمدتی دارند. با خوشهبندی اولیه رژیمهای بازار مشابه (مثلاً فروش افراطی با نوسان بالا، تثبیت با نوسان پایین) و سپس اعمال یک مکانیزم توجه درون آن زمینهها، این مدل میتواند سیگنال را از نویز مؤثرتر از یک شبکه یکپارچه LSTM یا GRU جدا کند. این شکلی از مدلسازی شرطی است—رفتار شبکه بهطور صریح بر اساس وضعیت شناساییشده بازار شرطی میشود.
جریان منطقی: خط پردازش بهطور ظریفی ترتیبی است: ۱) مهندسی ویژگی: دادههای خام OHLC به مجموعهای غنی از اندیکاتورهای تکنیکال (RSI, MACD, موقعیت باند بولینگر) تبدیل میشوند. ۲) خوشهبندی رژیم: یک الگوریتم خوشهبندی (احتمالاً K-Means یا مدل مخلوط گاوسی) دورههای تاریخی را بر اساس پروفایل اندیکاتورها به حالتهای متمایز تقسیم میکند. ۳) پیشبینی آگاه از زمینه: برای یک نقطه داده معین، مدل ابتدا خوشه آن را شناسایی میکند. سپس، یک مدل دنبالهای مبتنی بر توجه (مانند یک رمزگذار ترنسفورمر) تاریخچه اخیر را پردازش میکند، که وزنهای توجه آن بهطور بالقوه توسط هویت خوشه تعدیل میشوند، تا احتمال بازگشت به میانگین سودآور از یک وضعیت فروش افراطی را پیشبینی کند.
4. نقاط قوت و ضعف
نقاط قوت:
- نوآوری معماری: مرحله پیشپردازش خوشهبندی، راهی کاربردی برای معرفی مدیریت ناپایداری است که یک مشکل کلاسیک در امور مالی کمی است. این روش نسبت به امیدواری به یادگیری ضمنی رژیمها توسط یک شبکه عمیق، تفسیرپذیرتر است.
- تمرکز بر سناریوهای عملی: هدف قرار دادن شرایط "فروش افراطی" یک محدودیت هوشمندانه است. این کار یک مسئله پیشبینی باز را به یک مسئله طبقهبندی دودویی قابلکنترلتر تبدیل میکند: "آیا این سیگنال فروش افراطی فعلی یک فرصت خرید واقعی است یا یک تله؟"
- بنیان بر اندیکاتورهای تثبیتشده: استفاده از اندیکاتورهای تکنیکال شناختهشده به عنوان ویژگیها، ورودیهای مدل را برای معاملهگران سنتی قابل درک میکند و پذیرش بالقوه را تسهیل مینماید.
نقاط ضعف و شکافهای حیاتی:
- خطر سوگیری جستجوی داده: مجموعه داده ۲۰۰۵-۲۰۲۱ چندین بحران (۲۰۰۸، کووید-۱۹) را دربرمیگیرد. بدون تحلیل پیشرونده دقیق یا آزمون خارج از نمونه بر روی رژیمهای بازار کاملاً نادیدهگرفتهشده (مثلاً ۲۰۲۲-۲۰۲۴ با جنگ و تورم)، خطر بیشبرازش شدید است.
- توجه جعبه سیاه: اگرچه لایههای توجه قدرتمند هستند، توضیح اینکه چرا مدل به دورههای خاصی از گذشته توجه کرده است، همچنان چالشبرانگیز باقی میماند. در امور مالی تنظیمشده، "قابلتوجیه بودن" فقط یک ویژگی خوب نیست، بلکه ضروری است.
- عدم بحث درباره منبع آلفا: مقاله در مورد هزینههای معاملاتی، لغزش و مدیریت ریسک سکوت کرده است. یک استراتژی که در آزمونهای گذشته عالی به نظر میرسد، ممکن است به دلیل اصطکاکهای دنیای واقعی نابود شود. آیا مزیت پیشبینیشده پس از کسر هزینهها باقی میماند؟
5. بینشهای عملی
برای صندوقهای کمی و معاملهگران الگوریتمی:
- تکرار رویکرد خوشهبندی رژیم: قبل از ساخت مدل پیشبینی عمیق بعدی خود، دادههای تاریخی خود را به رژیمها تقسیم کنید. این مرحله ساده میتواند ثبات مدل را بهطور چشمگیری بهبود بخشد. از معیارهایی مانند نوسان، قدرت روند و همبستگی برای ویژگیهای خوشهبندی استفاده کنید.
- آزمون استرس بر روی "تغییر رژیمها": فقط بر روی تقسیمهای زمانی تصادفی آزمایش نکنید. عمداً عملکرد مدل خود را در طول تغییرات رژیم شناختهشده (مانند انتقال به بحران ۲۰۰۸ یا سقوط کووید ۲۰۲۰) آزمایش کنید. این آزمون واقعی است.
- ترکیب با دادههای بنیادی: تکامل بعدی این است که الگوریتم خوشهبندی نه تنها با اندیکاتورهای تکنیکال، بلکه با قطعات داده کلان (احساسات بانک مرکزی از اخبار، دادههای منحنی بازده) نیز تغذیه شود. این میتواند تعاریف رژیم قویتری ایجاد کند.
- درخواست قابلیت توجیه: ابزارهایی مانند SHAP یا LIME را برای تفسیر وزنهای توجه پیادهسازی کنید. مدل کدام روزهای گذشته را برای پیشبینی خود مهم دانسته است؟ این رد ممیزی برای اعتبارسنجی و انطباق مقرراتی حیاتی است.
6. تحلیل اصلی
مدل پیشنهادی نشاندهنده تلاشی پیچیده برای حل مسئله ناپایداری ذاتی در سریهای زمانی مالی است—چالشی که در آثار مهمی مانند "پیشرفتها در یادگیری ماشین مالی" اثر مارکوس لوپز د پرادو برجسته شده است. با بهکارگیری خوشهبندی به عنوان یک مرحله پیشپردازش برای شناسایی رژیمهای متمایز بازار، نویسندگان بهطور مؤثری یک معماری شرطی ایجاد میکنند. این از نظر مفهومی برتر از تغذیه دادههای دنبالهای خام به یک LSTM یکپارچه است، که اغلب در تطبیق حالت داخلی خود با دینامیکهای متغیر بازار مشکل دارد، همانطور که در مطالعات مقایسهای RNNهای سنتی با معماریهای مدرنتر برای امور مالی (مانند Borovkova & Tsiamas, 2019) اشاره شده است.
ادغام یک مکانیزم توجه، که احتمالاً از موفقیت ترنسفورمرها در پردازش زبان طبیعی (Vaswani و همکاران، ۲۰۱۷) الهام گرفته شده است، به مدل اجازه میدهد تا اهمیت نقاط تاریخی مختلف را بهطور پویا وزندهی کند. در زمینه یک سیگنال RSI فروش افراطی، مدل ممکن است یاد بگیرد که به رویدادهای مشابه فروش افراطی گذشته که با بازگشت قیمت همراه بودهاند، توجه شدیدی کند، در حالی که آنهایی را که منجر به کاهش بیشتر شدهاند نادیده بگیرد. این تمرکز انتخابی یک پیشرفت کلیدی نسبت به میانگینهای متحرک است که همه دادههای گذشته را یکسان در نظر میگیرند.
با این حال، پتانسیل مدل مشروط به کیفیت و نمایندگی دادههای آموزشی آن است. دوره ۲۰۰۵-۲۰۲۱ شامل رژیمهای نوسان خاصی است. مدلی که بر روی این دادهها آموزش دیده ممکن است در یک رژیم جدید، مانند محیط پس از ۲۰۲۲ با تورم بالا و نرخ بهره بالا—پدیدهای مشابه مشکلات جابجایی دامنه مورد بحث در ادبیات یادگیری ماشین (مانند در بینایی کامپیوتر با CycleGAN (Zhu و همکاران، ۲۰۱۷)، اما به همان اندازه در امور مالی حیاتی)—شکست بخورد. علاوه بر این، اگرچه اندیکاتورهای تکنیکال ارزشمند هستند، اما در نهایت تأخیری هستند. گنجاندن منابع داده جایگزین، همانطور که صندوقهای پوشش ریسک پیشرو مانند Two Sigma انجام میدهند، میتواند جهش بعدی ضروری باشد. آزمون واقعی این معماری، توانایی آن در تعمیم به ساختارهای بازار نادیدهگرفتهشده و عملکرد خالص آن پس از کسر تمام هزینههای معاملاتی خواهد بود.
7. جزئیات فنی و چارچوب ریاضی
نوآوری فنی اصلی در معماری دو مرحلهای مدل نهفته است.
مرحله ۱: خوشهبندی رژیم بازار
فرض کنید $\mathbf{F}_t = [f^1_t, f^2_t, ..., f^m_t]$ یک بردار ویژگی در زمان $t$ باشد، که شامل مقادیر نرمالشده اندیکاتورهای تکنیکال (RSI, MACD, موقعیت باند بولینگر، نوسان و غیره) است. یک الگوریتم خوشهبندی $C$ (مثلاً K-Means با $k$ خوشه) دادههای تاریخی را به $k$ رژیم تقسیم میکند:
$C(\mathbf{F}_t) = r_t \in \{1, 2, ..., k\}$.
هر خوشه $r$ نشاندهنده یک وضعیت بازار متمایز است (مثلاً "بازار گاوی با روند بالا"، "محدودهای با نوسان پایین"، "فروش افراطی با نوسان بالا").
مرحله ۲: پیشبینی دنباله مبتنی بر توجه
برای یک دنباله از بردارهای ویژگی اخیر $\mathbf{X} = [\mathbf{F}_{t-n}, ..., \mathbf{F}_{t-1}, \mathbf{F}_t]$ و برچسب رژیم مرتبط آن $r_t$، مدل هدف پیشبینی یک هدف $y_t$ (مثلاً برچسب دودویی برای افزایش قیمت پس از سیگنال فروش افراطی) را دارد. یک مکانیزم توجه یک بردار زمینه $\mathbf{c}_t$ را به عنوان مجموع وزنی دنباله ورودی محاسبه میکند:
$\mathbf{c}_t = \sum_{i=t-n}^{t} \alpha_i \mathbf{h}_i$,
که در آن $\mathbf{h}_i$ یک نمایش پنهان از $\mathbf{F}_i$ است، و وزنهای توجه $\alpha_i$ توسط رابطه زیر محاسبه میشوند:
$\alpha_i = \frac{\exp(\text{score}(\mathbf{h}_t, \mathbf{h}_i))}{\sum_{j=t-n}^{t} \exp(\text{score}(\mathbf{h}_t, \mathbf{h}_j))}$.
تابع امتیازدهی میتواند یک ضرب نقطهای ساده یا یک تابع یادگرفتهشده باشد. رژیم $r_t$ میتواند به عنوان یک جاسازی گنجانده شود که بر حالتهای پنهان اولیه یا تابع امتیازدهی توجه تأثیر میگذارد و تمرکز مدل را مشروط به وضعیت بازار میکند.
8. چارچوب تحلیل و مثال موردی
سناریو: جفت ارز EUR/USD، ۱۵ اکتبر ۲۰۲۰. RSI به ۲۸ کاهش مییابد که نشاندهنده شرایط فروش افراطی است.
کاربرد چارچوب:
- استخراج ویژگی: محاسبه بردار ویژگی $\mathbf{F}_t$: RSI=28، هیستوگرام MACD منفی اما در حال افزایش، قیمت لمس باند پایینی بولینگر، نوسان ۳۰ روزه = ۸٪.
- طبقهبندی رژیم: مدل خوشهبندی، که بر روی دادههای ۲۰۰۵-۲۰۱۹ آموزش دیده است، $\mathbf{F}_t$ را میگیرد و آن را به خوشه شماره ۳ اختصاص میدهد، که برچسب "فروش افراطی در نوسان متوسط با مومنتوم نزولی ضعیف" خورده است.
- پیشبینی آگاه از زمینه: پیشبین مبتنی بر توجه، که اکنون بهطور خاص بر "خوشه شماره ۳" شرطی شده است، دادههای ۲۰ روز گذشته را تحلیل میکند. لایه توجه ممکن است وزنهای بالایی به روزهای ۵ و ۱۲ قبل اختصاص دهد، که پروفایل ویژگی مشابهی داشتند و با بازگشت ۲٪ قیمت در عرض ۵ روز همراه بودند.
- خروجی: مدل یک احتمال بالا (مثلاً ۷۲٪) برای یک معامله موفق بازگشت به میانگین (افزایش قیمت >۱٪ در عرض ۳ روز) خروجی میدهد. این یک سیگنال کمیشده و غنی از زمینه فراتر از یک قانون ساده "RSI < 30" ارائه میدهد.
توجه: این یک مثال مفهومی است. منطق واقعی مدل توسط پارامترهای آموزشدیده آن تعریف میشود.
9. کاربردها و جهتهای آینده
معماری پیشنهادی مسیرهای امیدوارکنندهای برای گسترش دارد:
- رژیمهای چند دارایی و فرابازاری: همان خوشهبندی را بر روی داراییهای همبسته (مانند جفتارزهای اصلی فارکس، شاخصها، کالاها) اعمال کنید تا رژیمهای مالی جهانی را شناسایی کرده و ارزیابی ریسک سیستماتیک را بهبود بخشید.
- ادغام با دادههای جایگزین: امتیازات احساسات خبری بلادرنگ (از مدلهای NLP) یا لحن ارتباطات بانک مرکزی را در بردار ویژگی $\mathbf{F}_t$ برای خوشهبندی بگنجانید تا رژیمهایی تعریف شده توسط شرایط تکنیکال و بنیادی ایجاد کنید.
- ادغام با یادگیری تقویتی (RL): از مدل خوشهبندی-توجه به عنوان ماژول نمایش حالت درون یک عامل RL استفاده کنید که سیاستهای معاملاتی بهینه (ورود، خروج، اندازه موقعیت) را برای هر رژیم شناساییشده یاد میگیرد و از پیشبینی به بهینهسازی مستقیم استراتژی حرکت میکند.
- هوش مصنوعی قابل توجیه (XAI) برای مقررات: رابطهای توضیح پسینی توسعه دهید که به وضوح نشان دهند: "این سیگنال معاملاتی فعال شد زیرا بازار در رژیم X است و مدل بر الگوهای تاریخی A، B و C تمرکز کرده است." این برای پذیرش در مؤسسات تنظیمشده حیاتی است.
- یادگیری آنلاین تطبیقی: مکانیزمهایی برای مدل خوشهبندی پیادهسازی کنید تا با دادههای جدید بهطور افزایشی بهروزرسانی شود و به آن اجازه دهد رژیمهای بازار کاملاً جدید را بهطور بلادرنگ شناسایی و تطبیق دهد و خطر زوال مدل را کاهش دهد.
10. منابع
- López de Prado, M. (2018). Advances in Financial Machine Learning. Wiley.
- Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems 30 (NIPS 2017).
- Borovkova, S., & Tsiamas, I. (2019). An ensemble of LSTM neural networks for high-frequency stock market classification. Journal of Forecasting, 38(6), 600-619.
- Zhu, J.-Y., et al. (2017). Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. IEEE International Conference on Computer Vision (ICCV).
- Murphy, J. J. (1999). Technical Analysis of the Financial Markets. New York Institute of Finance.
- Investopedia. (n.d.). Technical Indicators. Retrieved from https://www.investopedia.com.