مدل خوشه‌بندی و مبتنی بر مکانیزم توجه برای معاملات هوشمند فارکس

1. مقدمه

بازار ارز خارجی (فارکس) بزرگ‌ترین بازار مالی جهان است که با نقدینگی بالا، نوسان و پیچیدگی شناخته می‌شود. پیش‌بینی حرکات قیمت فارکس به دلیل تأثیر عوامل کلان اقتصادی متعدد، رویدادهای ژئوپلیتیک و احساسات بازار، به‌طور مشهوری دشوار است. تحلیل تکنیکال سنتی، اگرچه مفید است، اغلب در تطبیق با تغییرات ناگهانی بازار یا رویدادهای "قوی سیاه" ناتوان است. این مقاله یک رویکرد نوین یادگیری ماشین را پیشنهاد می‌کند که تکنیک‌های خوشه‌بندی را با مکانیزم‌های توجه ترکیب می‌کند تا دقت پیش‌بینی را بهبود بخشد و به‌طور خاص شرایط بازار فروش‌شده را برای استراتژی‌های معاملاتی رویداد-محور هدف قرار می‌دهد. این مدل از داده‌های تاریخی فارکس و اندیکاتورهای تکنیکال استخراج‌شده از سال ۲۰۰۵ تا ۲۰۲۱ استفاده می‌کند.

2. ادبیات مرتبط

این پژوهش بر پایه‌ی نظریه مالی تثبیت‌شده و کاربردهای یادگیری ماشین در امور مالی کمی بنا شده است.

2.1 اندیکاتورهای تکنیکال

اندیکاتورهای تکنیکال محاسبات ریاضی مبتنی بر قیمت تاریخی، حجم یا موقعیت‌های باز هستند که برای پیش‌بینی جهت بازارهای مالی استفاده می‌شوند. این مدل چندین اندیکاتور کلیدی را دربرمی‌گیرد.

2.1.1 شاخص قدرت نسبی (RSI)

RSI یک نوسان‌ساز مومنتوم است که سرعت و تغییر حرکات قیمت را اندازه‌گیری می‌کند. از آن برای شناسایی شرایط خرید افراطی یا فروش افراطی استفاده می‌شود.

فرمول: $RSI = 100 - \frac{100}{1 + RS}$ که در آن $RS = \frac{\text{میانگین سود در N دوره}}{\text{میانگین زیان در N دوره}}$.

مقدار RSI زیر ۳۰ معمولاً نشان‌دهنده‌ی شرایط فروش افراطی (فرصت بالقوه خرید) است، در حالی که RSI بالای ۷۰ شرایط خرید افراطی (فرصت بالقوه فروش) را نشان می‌دهد.

2.1.2 میانگین متحرک ساده (SMA)، میانگین متحرک نمایی (EMA)، MACD

SMA میانگین بدون وزن N نقطه داده قبلی است. EMA وزن بیشتری به قیمت‌های اخیر می‌دهد. واگرایی همگرایی میانگین متحرک (MACD) یک اندیکاتور مومنتوم دنبال‌کننده روند است.

فرمول: $MACD = EMA(\text{12 دوره}) - EMA(\text{26 دوره})$.

از یک خط سیگنال (EMA 9 روزه MACD) برای تولید سیگنال‌های معاملاتی استفاده می‌شود. تقاطع‌های بین MACD و خط سیگنال نشان‌دهنده روندهای بالقوه صعودی یا نزولی است.

2.1.3 باندهای بولینگر

باندهای بولینگر شامل یک خط SMA میانی با دو باند بیرونی است که در سطوح انحراف معیار (معمولاً ۲) ترسیم شده‌اند. آن‌ها نوسان بازار را اندازه‌گیری می‌کنند. فشردگی (باریک شدن باندها) اغلب مقدمه‌ای برای دوره‌ای از نوسان بالا است، در حالی که حرکت قیمت خارج از باندها ممکن است نشان‌دهنده ادامه یا بازگشت روند باشد.

3. بینش اصلی و جریان منطقی

بینش اصلی: شرط اساسی مقاله این است که مدل‌های سری زمانی خالص قیمت/اندیکاتور، دید کوتاه‌مدتی دارند. با خوشه‌بندی اولیه رژیم‌های بازار مشابه (مثلاً فروش افراطی با نوسان بالا، تثبیت با نوسان پایین) و سپس اعمال یک مکانیزم توجه درون آن زمینه‌ها، این مدل می‌تواند سیگنال را از نویز مؤثرتر از یک شبکه یکپارچه LSTM یا GRU جدا کند. این شکلی از مدل‌سازی شرطی است—رفتار شبکه به‌طور صریح بر اساس وضعیت شناسایی‌شده بازار شرطی می‌شود.

جریان منطقی: خط پردازش به‌طور ظریفی ترتیبی است: ۱) مهندسی ویژگی: داده‌های خام OHLC به مجموعه‌ای غنی از اندیکاتورهای تکنیکال (RSI, MACD, موقعیت باند بولینگر) تبدیل می‌شوند. ۲) خوشه‌بندی رژیم: یک الگوریتم خوشه‌بندی (احتمالاً K-Means یا مدل مخلوط گاوسی) دوره‌های تاریخی را بر اساس پروفایل اندیکاتورها به حالت‌های متمایز تقسیم می‌کند. ۳) پیش‌بینی آگاه از زمینه: برای یک نقطه داده معین، مدل ابتدا خوشه آن را شناسایی می‌کند. سپس، یک مدل دنباله‌ای مبتنی بر توجه (مانند یک رمزگذار ترنسفورمر) تاریخچه اخیر را پردازش می‌کند، که وزن‌های توجه آن به‌طور بالقوه توسط هویت خوشه تعدیل می‌شوند، تا احتمال بازگشت به میانگین سودآور از یک وضعیت فروش افراطی را پیش‌بینی کند.

4. نقاط قوت و ضعف

نقاط قوت:

نوآوری معماری: مرحله پیش‌پردازش خوشه‌بندی، راهی کاربردی برای معرفی مدیریت ناپایداری است که یک مشکل کلاسیک در امور مالی کمی است. این روش نسبت به امیدواری به یادگیری ضمنی رژیم‌ها توسط یک شبکه عمیق، تفسیرپذیرتر است.
تمرکز بر سناریوهای عملی: هدف قرار دادن شرایط "فروش افراطی" یک محدودیت هوشمندانه است. این کار یک مسئله پیش‌بینی باز را به یک مسئله طبقه‌بندی دودویی قابل‌کنترل‌تر تبدیل می‌کند: "آیا این سیگنال فروش افراطی فعلی یک فرصت خرید واقعی است یا یک تله؟"
بنیان بر اندیکاتورهای تثبیت‌شده: استفاده از اندیکاتورهای تکنیکال شناخته‌شده به عنوان ویژگی‌ها، ورودی‌های مدل را برای معامله‌گران سنتی قابل درک می‌کند و پذیرش بالقوه را تسهیل می‌نماید.

نقاط ضعف و شکاف‌های حیاتی:

خطر سوگیری جستجوی داده: مجموعه داده ۲۰۰۵-۲۰۲۱ چندین بحران (۲۰۰۸، کووید-۱۹) را دربرمی‌گیرد. بدون تحلیل پیش‌رونده دقیق یا آزمون خارج از نمونه بر روی رژیم‌های بازار کاملاً نادیده‌گرفته‌شده (مثلاً ۲۰۲۲-۲۰۲۴ با جنگ و تورم)، خطر بیش‌برازش شدید است.
توجه جعبه سیاه: اگرچه لایه‌های توجه قدرتمند هستند، توضیح اینکه چرا مدل به دوره‌های خاصی از گذشته توجه کرده است، همچنان چالش‌برانگیز باقی می‌ماند. در امور مالی تنظیم‌شده، "قابل‌توجیه بودن" فقط یک ویژگی خوب نیست، بلکه ضروری است.
عدم بحث درباره منبع آلفا: مقاله در مورد هزینه‌های معاملاتی، لغزش و مدیریت ریسک سکوت کرده است. یک استراتژی که در آزمون‌های گذشته عالی به نظر می‌رسد، ممکن است به دلیل اصطکاک‌های دنیای واقعی نابود شود. آیا مزیت پیش‌بینی‌شده پس از کسر هزینه‌ها باقی می‌ماند؟

5. بینش‌های عملی

برای صندوق‌های کمی و معامله‌گران الگوریتمی:

تکرار رویکرد خوشه‌بندی رژیم: قبل از ساخت مدل پیش‌بینی عمیق بعدی خود، داده‌های تاریخی خود را به رژیم‌ها تقسیم کنید. این مرحله ساده می‌تواند ثبات مدل را به‌طور چشمگیری بهبود بخشد. از معیارهایی مانند نوسان، قدرت روند و همبستگی برای ویژگی‌های خوشه‌بندی استفاده کنید.
آزمون استرس بر روی "تغییر رژیم‌ها": فقط بر روی تقسیم‌های زمانی تصادفی آزمایش نکنید. عمداً عملکرد مدل خود را در طول تغییرات رژیم شناخته‌شده (مانند انتقال به بحران ۲۰۰۸ یا سقوط کووید ۲۰۲۰) آزمایش کنید. این آزمون واقعی است.
ترکیب با داده‌های بنیادی: تکامل بعدی این است که الگوریتم خوشه‌بندی نه تنها با اندیکاتورهای تکنیکال، بلکه با قطعات داده کلان (احساسات بانک مرکزی از اخبار، داده‌های منحنی بازده) نیز تغذیه شود. این می‌تواند تعاریف رژیم قوی‌تری ایجاد کند.
درخواست قابلیت توجیه: ابزارهایی مانند SHAP یا LIME را برای تفسیر وزن‌های توجه پیاده‌سازی کنید. مدل کدام روزهای گذشته را برای پیش‌بینی خود مهم دانسته است؟ این رد ممیزی برای اعتبارسنجی و انطباق مقرراتی حیاتی است.

6. تحلیل اصلی

مدل پیشنهادی نشان‌دهنده تلاشی پیچیده برای حل مسئله ناپایداری ذاتی در سری‌های زمانی مالی است—چالشی که در آثار مهمی مانند "پیشرفت‌ها در یادگیری ماشین مالی" اثر مارکوس لوپز د پرادو برجسته شده است. با به‌کارگیری خوشه‌بندی به عنوان یک مرحله پیش‌پردازش برای شناسایی رژیم‌های متمایز بازار، نویسندگان به‌طور مؤثری یک معماری شرطی ایجاد می‌کنند. این از نظر مفهومی برتر از تغذیه داده‌های دنباله‌ای خام به یک LSTM یکپارچه است، که اغلب در تطبیق حالت داخلی خود با دینامیک‌های متغیر بازار مشکل دارد، همان‌طور که در مطالعات مقایسه‌ای RNNهای سنتی با معماری‌های مدرن‌تر برای امور مالی (مانند Borovkova & Tsiamas, 2019) اشاره شده است.

ادغام یک مکانیزم توجه، که احتمالاً از موفقیت ترنسفورمرها در پردازش زبان طبیعی (Vaswani و همکاران، ۲۰۱۷) الهام گرفته شده است، به مدل اجازه می‌دهد تا اهمیت نقاط تاریخی مختلف را به‌طور پویا وزن‌دهی کند. در زمینه یک سیگنال RSI فروش افراطی، مدل ممکن است یاد بگیرد که به رویدادهای مشابه فروش افراطی گذشته که با بازگشت قیمت همراه بوده‌اند، توجه شدیدی کند، در حالی که آن‌هایی را که منجر به کاهش بیشتر شده‌اند نادیده بگیرد. این تمرکز انتخابی یک پیشرفت کلیدی نسبت به میانگین‌های متحرک است که همه داده‌های گذشته را یکسان در نظر می‌گیرند.

با این حال، پتانسیل مدل مشروط به کیفیت و نمایندگی داده‌های آموزشی آن است. دوره ۲۰۰۵-۲۰۲۱ شامل رژیم‌های نوسان خاصی است. مدلی که بر روی این داده‌ها آموزش دیده ممکن است در یک رژیم جدید، مانند محیط پس از ۲۰۲۲ با تورم بالا و نرخ بهره بالا—پدیده‌ای مشابه مشکلات جابجایی دامنه مورد بحث در ادبیات یادگیری ماشین (مانند در بینایی کامپیوتر با CycleGAN (Zhu و همکاران، ۲۰۱۷)، اما به همان اندازه در امور مالی حیاتی)—شکست بخورد. علاوه بر این، اگرچه اندیکاتورهای تکنیکال ارزشمند هستند، اما در نهایت تأخیری هستند. گنجاندن منابع داده جایگزین، همان‌طور که صندوق‌های پوشش ریسک پیشرو مانند Two Sigma انجام می‌دهند، می‌تواند جهش بعدی ضروری باشد. آزمون واقعی این معماری، توانایی آن در تعمیم به ساختارهای بازار نادیده‌گرفته‌شده و عملکرد خالص آن پس از کسر تمام هزینه‌های معاملاتی خواهد بود.

7. جزئیات فنی و چارچوب ریاضی

نوآوری فنی اصلی در معماری دو مرحله‌ای مدل نهفته است.

مرحله ۱: خوشه‌بندی رژیم بازار
فرض کنید $\mathbf{F}_t = [f^1_t, f^2_t, ..., f^m_t]$ یک بردار ویژگی در زمان $t$ باشد، که شامل مقادیر نرمال‌شده اندیکاتورهای تکنیکال (RSI, MACD, موقعیت باند بولینگر، نوسان و غیره) است. یک الگوریتم خوشه‌بندی $C$ (مثلاً K-Means با $k$ خوشه) داده‌های تاریخی را به $k$ رژیم تقسیم می‌کند:
$C(\mathbf{F}_t) = r_t \in \{1, 2, ..., k\}$.
هر خوشه $r$ نشان‌دهنده یک وضعیت بازار متمایز است (مثلاً "بازار گاوی با روند بالا"، "محدوده‌ای با نوسان پایین"، "فروش افراطی با نوسان بالا").

مرحله ۲: پیش‌بینی دنباله مبتنی بر توجه
برای یک دنباله از بردارهای ویژگی اخیر $\mathbf{X} = [\mathbf{F}_{t-n}, ..., \mathbf{F}_{t-1}, \mathbf{F}_t]$ و برچسب رژیم مرتبط آن $r_t$، مدل هدف پیش‌بینی یک هدف $y_t$ (مثلاً برچسب دودویی برای افزایش قیمت پس از سیگنال فروش افراطی) را دارد. یک مکانیزم توجه یک بردار زمینه $\mathbf{c}_t$ را به عنوان مجموع وزنی دنباله ورودی محاسبه می‌کند:
$\mathbf{c}_t = \sum_{i=t-n}^{t} \alpha_i \mathbf{h}_i$,
که در آن $\mathbf{h}_i$ یک نمایش پنهان از $\mathbf{F}_i$ است، و وزن‌های توجه $\alpha_i$ توسط رابطه زیر محاسبه می‌شوند:
$\alpha_i = \frac{\exp(\text{score}(\mathbf{h}_t, \mathbf{h}_i))}{\sum_{j=t-n}^{t} \exp(\text{score}(\mathbf{h}_t, \mathbf{h}_j))}$.
تابع امتیازدهی می‌تواند یک ضرب نقطه‌ای ساده یا یک تابع یادگرفته‌شده باشد. رژیم $r_t$ می‌تواند به عنوان یک جاسازی گنجانده شود که بر حالت‌های پنهان اولیه یا تابع امتیازدهی توجه تأثیر می‌گذارد و تمرکز مدل را مشروط به وضعیت بازار می‌کند.

8. چارچوب تحلیل و مثال موردی

سناریو: جفت ارز EUR/USD، ۱۵ اکتبر ۲۰۲۰. RSI به ۲۸ کاهش می‌یابد که نشان‌دهنده شرایط فروش افراطی است.

کاربرد چارچوب:

استخراج ویژگی: محاسبه بردار ویژگی $\mathbf{F}_t$: RSI=28، هیستوگرام MACD منفی اما در حال افزایش، قیمت لمس باند پایینی بولینگر، نوسان ۳۰ روزه = ۸٪.
طبقه‌بندی رژیم: مدل خوشه‌بندی، که بر روی داده‌های ۲۰۰۵-۲۰۱۹ آموزش دیده است، $\mathbf{F}_t$ را می‌گیرد و آن را به خوشه شماره ۳ اختصاص می‌دهد، که برچسب "فروش افراطی در نوسان متوسط با مومنتوم نزولی ضعیف" خورده است.
پیش‌بینی آگاه از زمینه: پیش‌بین مبتنی بر توجه، که اکنون به‌طور خاص بر "خوشه شماره ۳" شرطی شده است، داده‌های ۲۰ روز گذشته را تحلیل می‌کند. لایه توجه ممکن است وزن‌های بالایی به روزهای ۵ و ۱۲ قبل اختصاص دهد، که پروفایل ویژگی مشابهی داشتند و با بازگشت ۲٪ قیمت در عرض ۵ روز همراه بودند.
خروجی: مدل یک احتمال بالا (مثلاً ۷۲٪) برای یک معامله موفق بازگشت به میانگین (افزایش قیمت >۱٪ در عرض ۳ روز) خروجی می‌دهد. این یک سیگنال کمی‌شده و غنی از زمینه فراتر از یک قانون ساده "RSI < 30" ارائه می‌دهد.

توجه: این یک مثال مفهومی است. منطق واقعی مدل توسط پارامترهای آموزش‌دیده آن تعریف می‌شود.

9. کاربردها و جهت‌های آینده

معماری پیشنهادی مسیرهای امیدوارکننده‌ای برای گسترش دارد:

رژیم‌های چند دارایی و فرابازاری: همان خوشه‌بندی را بر روی دارایی‌های همبسته (مانند جفت‌ارزهای اصلی فارکس، شاخص‌ها، کالاها) اعمال کنید تا رژیم‌های مالی جهانی را شناسایی کرده و ارزیابی ریسک سیستماتیک را بهبود بخشید.
ادغام با داده‌های جایگزین: امتیازات احساسات خبری بلادرنگ (از مدل‌های NLP) یا لحن ارتباطات بانک مرکزی را در بردار ویژگی $\mathbf{F}_t$ برای خوشه‌بندی بگنجانید تا رژیم‌هایی تعریف شده توسط شرایط تکنیکال و بنیادی ایجاد کنید.
ادغام با یادگیری تقویتی (RL): از مدل خوشه‌بندی-توجه به عنوان ماژول نمایش حالت درون یک عامل RL استفاده کنید که سیاست‌های معاملاتی بهینه (ورود، خروج، اندازه موقعیت) را برای هر رژیم شناسایی‌شده یاد می‌گیرد و از پیش‌بینی به بهینه‌سازی مستقیم استراتژی حرکت می‌کند.
هوش مصنوعی قابل توجیه (XAI) برای مقررات: رابط‌های توضیح پسینی توسعه دهید که به وضوح نشان دهند: "این سیگنال معاملاتی فعال شد زیرا بازار در رژیم X است و مدل بر الگوهای تاریخی A، B و C تمرکز کرده است." این برای پذیرش در مؤسسات تنظیم‌شده حیاتی است.
یادگیری آنلاین تطبیقی: مکانیزم‌هایی برای مدل خوشه‌بندی پیاده‌سازی کنید تا با داده‌های جدید به‌طور افزایشی به‌روزرسانی شود و به آن اجازه دهد رژیم‌های بازار کاملاً جدید را به‌طور بلادرنگ شناسایی و تطبیق دهد و خطر زوال مدل را کاهش دهد.

10. منابع

López de Prado, M. (2018). Advances in Financial Machine Learning. Wiley.
Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems 30 (NIPS 2017).
Borovkova, S., & Tsiamas, I. (2019). An ensemble of LSTM neural networks for high-frequency stock market classification. Journal of Forecasting, 38(6), 600-619.
Zhu, J.-Y., et al. (2017). Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. IEEE International Conference on Computer Vision (ICCV).
Murphy, J. J. (1999). Technical Analysis of the Financial Markets. New York Institute of Finance.
Investopedia. (n.d.). Technical Indicators. Retrieved from https://www.investopedia.com.