3.1. المعالجة المسبقة للبيانات
يتم تنظيف بيانات الفوركس الخام وتطبيعها وهيكلتها في خطوات زمنية متسلسلة مناسبة لإدخال LSTM. قد تتضمن هندسة الميزات مؤشرات فنية (مثل المتوسطات المتحركة، RSI).
يمثل سوق الصرف الأجنبي (الفوركس)، بحجم تداول يومي يتجاوز 5 تريليون دولار، أكبر الأسواق المالية وأكثرها سيولة على مستوى العالم. يعد التنبؤ الدقيق بأسعار صرف العملات، وخاصة للأزواج الرئيسية مثل اليورو/الدولار، أمرًا بالغ الأهمية لإدارة المخاطر وتعظيم العوائد. تبحث هذه الدراسة في تطبيق شبكات الذاكرة طويلة المدى قصيرة المدى (LSTM) لهذه المهمة، مع تركيز مزدوج: تحسين دقة التنبؤ وتقييم الآثار المترتبة على النموذج فيما يتعلق باستهلاك الطاقة الحسابية. يهدف البحث إلى الربط بين التنبؤ المالي وممارسات الحوسبة المستدامة.
تطور التنبؤ بالفوركس من التحليل الفني والأساسي التقليدي إلى تقنيات التعلم الآلي المتطورة. اعتمدت النماذج المبكرة على طرق السلاسل الزمنية الإحصائية (مثل ARIMA). وكان ظهور الشبكات العصبية الاصطناعية (ANNs) وآلات ناقلات الدعم (SVMs) بمثابة تحول كبير. مؤخرًا، اكتسبت نماذج التعلم العميق، وخاصة LSTM والهجينة منها (مثل LSTM-RCN)، أهمية بسبب قدرتها على التقاط التبعيات الزمنية طويلة المدى في البيانات المالية المتقلبة - وهي ميزة حاسمة مقارنة بالنماذج الأبسط.
تستخدم الدراسة نهج التعلم الخاضع للإشراف باستخدام بيانات تاريخية لسعر صرف اليورو/الدولار.
يتم تنظيف بيانات الفوركس الخام وتطبيعها وهيكلتها في خطوات زمنية متسلسلة مناسبة لإدخال LSTM. قد تتضمن هندسة الميزات مؤشرات فنية (مثل المتوسطات المتحركة، RSI).
تم تصميم بنية LSTM متعددة الطبقات. يتضمن النموذج طبقات LSM لمعالجة التسلسل، تليها طبقات كثيفة (Dense) للتنبؤ بالمخرجات. يتم ضبط المعلمات الفائقة مثل عدد الطبقات والوحدات ومعدلات الإسقاط (Dropout).
يتم تقييم أداء النموذج بدقة باستخدام ثلاثة مقاييس رئيسية:
أظهر نموذج LSTM المُحسّن، الذي تم تدريبه لمدة 90 دورة تدريبية، أداءً متفوقًا مقارنة بالنماذج الأساسية (مثل RNN البسيط، ARIMA). تشمل النتائج الرئيسية:
تسلط الدراسة الضوء على جانب حاسم غالبًا ما يتم تجاهله: التكلفة الحسابية للتعلم العميق. يتطلب تدريب نماذج LSTM المعقدة موارد كبيرة لوحدة معالجة الرسومات/وحدة المعالجة المركزية، مما يؤدي إلى استهلاك مرتفع للطاقة. يجادل البحث بأن تحسين النموذج (مثل البنية الفعالة، التوقف المبكر عند 90 دورة تدريبية) لا يحسن الدقة فحسب، بل يقلل أيضًا من الحمل الحسابي، وبالتالي يخفض البصمة الكربونية المرتبطة به ويساهم في الاستدامة البيئية في التداول الخوارزمي.
الرؤية الأساسية: القيمة الحقيقية لهذا البحث ليست مجرد نتيجة أخرى "تفوق LSTM النموذج الأساسي في التمويل". رؤيته المحورية هي صياغة تحسين النموذج كمشكلة ذات هدف مزدوج: تعظيم القوة التنبؤية مع تقليل إنفاق الطاقة الحسابية. في عصر تخضع فيه البصمة الكربونية للذكاء الاصطناعي للتدقيق (كما هو موضح في دراسات مثل تلك الصادرة عن مبادرة ML CO2 Impact)، فإن هذا يغير الهدف من مجرد الدقة إلى الدقة الفعالة.
التسلسل المنطقي: يتقدم الجدال منطقيًا: 1) التنبؤ بالفوركس ذو قيمة ولكنه مكثف حسابيًا. 2) نماذج LSTM هي الأحدث في مجال التنبؤ بالتسلسل. 3) يمكننا تحسينها (الهندسة، الدورات التدريبية). 4) التحسين يحسن المقاييس (MSE، MAE، R²). 5) والأهم من ذلك، هذا التحسين نفسه يقلل من الحسابات الزائدة، مما يوفر الطاقة. 6) هذا يتماشى مع مبادئ الذكاء الاصطناعي الأخضر الأوسع. تم إثبات الرابط بين كفاءة النموذج وكفاءة الطاقة بشكل مقنع.
نقاط القوة والضعف: نقطة القوة: الزاوية متعددة التخصصات استباقية وضرورية. فهي تربط التكنولوجيا المالية بالحوسبة المستدامة. استخدام المقاييس القياسية (MSE، MAE، R²) يجعل ادعاءات الأداء قابلة للتحقق. نقطة ضعف كبيرة: البحث يفتقر بشكل واضح إلى تحديد كمي لتوفير الطاقة. يذكر المفهوم لكنه يفتقر إلى بيانات صلبة - لا يوجد جولات موفرة، ولا انخفاض في مكافئ الكربون، ولا مقارنة لاستخدام الطاقة لكل دورة تدريبية. هذه فرصة ضائعة كبرى. بدون هذا التحديد الكمي، يبقى جدال الطاقة نوعيًا واستنتاجيًا بدلاً من كونه قاطعًا. علاوة على ذلك، لم يتم تناول متانة النموذج تجاه أحداث السوق المتطرفة ("البجع الأسود") - وهي فجوة حرجة لأنظمة التداول الواقعية.
رؤى قابلة للتنفيذ: لمحترفي الكميات وفرق الذكاء الاصطناعي: 1) أدوات التدريب: ابدأ فورًا في تتبع استهلاك طاقة وحدة معالجة الرسومات (باستخدام أدوات مثل NVIDIA-SMI) جنبًا إلى جنب مع مقاييس الخسارة. أنشئ معيارًا لـ "الأداء لكل واط". 2) تجاوز التوقف المبكر: جرب تقنيات كفاءة أكثر تقدمًا مثل تقليم النموذج، أو التكميم (كما تم استكشافه في TensorFlow Lite)، أو تقطير المعرفة لإنشاء نماذج أصغر حجمًا وأسرع وأقل استهلاكًا للطاقة مع الحفاظ على الدقة. 3) اختبار الإجهاد للمتانة: تحقق من صحة النموذج ليس فقط في الفترات العادية ولكن على بيانات الأزمات ذات التقلبات العالية. النموذج الذي يفشل بصمت أثناء انهيار السوق أسوأ من عدم الفائدة. المستقبل ينتمي للنماذج الذكية والفعالة في نفس الوقت.
جوهر خلية LSTM يتعامل مع مشكلة تلاشي التدرج من خلال آلية البوابات. المعادلات الرئيسية للخطوة الزمنية الواحدة (t) هي:
بوابة النسيان: $f_t = \sigma(W_f \cdot [h_{t-1}, x_t] + b_f)$
بوابة الإدخال: $i_t = \sigma(W_i \cdot [h_{t-1}, x_t] + b_i)$
حالة الخلية المرشحة: $\tilde{C}_t = \tanh(W_C \cdot [h_{t-1}, x_t] + b_C)$
تحديث حالة الخلية: $C_t = f_t * C_{t-1} + i_t * \tilde{C}_t$
بوابة الإخراج: $o_t = \sigma(W_o \cdot [h_{t-1}, x_t] + b_o)$
إخراج الحالة المخفية: $h_t = o_t * \tanh(C_t)$
حيث $\sigma$ هي دالة السيني، $*$ تشير إلى الضرب العنصر بعنصر، $W$ و $b$ هما الأوزان والانحيازات، $h$ هي الحالة المخفية، و $x$ هو الإدخال.
دالة الخسارة للنموذج أثناء التدريب هي عادةً متوسط مربعات الخطأ (MSE)، كما تم تعريفه سابقًا، والتي يقوم المُحسّن (مثل Adam) بتقليلها عن طريق ضبط الأوزان (W, b).
السيناريو: تريد مؤسسة تحوط كمية تطوير إشارة تداول منخفضة الكمون ومراعية للطاقة لزوج اليورو/الدولار.
تطبيق الإطار: