Выбрать язык

Прогнозирование обменного курса USD/BDT с использованием LSTM и машинного обучения

Исследование применения нейронных сетей LSTM и градиентного бустинга для высокоточного прогнозирования курса доллара США к бангладешской таке, анализ производительности и практических последствий для торговли.
computecurrency.net | PDF Size: 0.4 MB
Оценка: 4.5/5
Ваша оценка
Вы уже оценили этот документ
Обложка PDF-документа - Прогнозирование обменного курса USD/BDT с использованием LSTM и машинного обучения

1. Введение

Точное прогнозирование обменного курса доллара США к бангладешской таке (USD/BDT) имеет критическое значение для экономики Бангладеш, зависящей от импорта, влияя на торговый баланс, инфляцию и управление валютными резервами. Традиционные статистические модели часто не способны уловить нелинейные, сложные паттерны, характерные для валют развивающихся рынков, особенно в условиях экономической неопределенности. Данное исследование устраняет этот пробел путем разработки и оценки передовых моделей машинного обучения, в частности, нейронных сетей с долгой краткосрочной памятью (LSTM) и классификаторов на основе градиентного бустинга (GBC), с использованием исторических данных за период с 2018 по 2023 год. Цель исследования — предоставить надежные инструменты для снижения финансовых рисков и формирования политики.

2. Обзор литературы

Применение глубокого обучения, в частности сетей LSTM, показало значительный потенциал в прогнозировании финансовых временных рядов. Созданные Хохрайтером и Шмидхубером для решения проблемы исчезающего градиента в RNN, LSTM превосходно справляются с захватом долгосрочных зависимостей. Последующие улучшения, такие как вентили забывания (Герс и др.), повысили адаптивность к волатильности. Эмпирические исследования, например, по паре USD/INR, демонстрируют, что LSTM превосходят традиционные модели ARIMA на 18–22% по точности определения направления. Однако исследования, специально посвященные паре USD/BDT с учетом уникального режима управляемого плавания Бангладеш и локальных макроэкономических шоков, остаются ограниченными. Данное исследование основывается на этой зарождающейся области и расширяет ее.

3. Методология и данные

3.1 Сбор и предобработка данных

Ежедневные данные по обменному курсу USD/BDT с января 2018 по декабрь 2023 года были получены из Yahoo Finance. Набор данных был очищен, а такие признаки, как нормализованная дневная доходность, простые скользящие средние (SMA) и индекс относительной силы (RSI), были сконструированы для отражения рыночных трендов и волатильности. Данные были разделены на обучающую (80%) и тестовую (20%) выборки.

3.2 Архитектура модели LSTM

Основной прогнозной моделью является многослойная сеть LSTM. Архитектура обычно включает:

  • Входной слой: Последовательности исторических данных о ценах/признаках.
  • Слои LSTM: Два или более слоя с применением dropout для регуляризации с целью предотвращения переобучения.
  • Полносвязный слой: Полностью связанный слой для вывода.
  • Выходной слой: Один нейрон для прогнозирования обменного курса на следующий период.

Модель обучалась с использованием оптимизатора Adam и среднеквадратичной ошибки (MSE) в качестве функции потерь.

3.3 Классификатор на основе градиентного бустинга

Для прогнозирования направления движения (вверх/вниз) был реализован классификатор на основе градиентного бустинга (GBC). Он использует ансамбль слабых прогнозных моделей (деревья решений) для создания сильного классификатора, фокусируясь на минимизации ошибки прогнозирования посредством итеративного обучения.

Точность LSTM

99.449%

СКО LSTM

0.9858

Доля прибыльных сделок (GBC)

40.82%

СКО ARIMA (базовый уровень)

1.342

4. Результаты экспериментов и анализ

4.1 Метрики производительности

Модель LSTM показала выдающиеся результаты: точность 99.449%, среднеквадратичная ошибка (СКО) 0.9858 и потери на тестовой выборке 0.8523. Эта производительность значительно превзошла традиционную модель ARIMA, у которой СКО составила 1.342. Высокая точность указывает на превосходную способность LSTM моделировать сложную временную динамику обменного курса USD/BDT.

4.2 Бэктестинг и торговое моделирование

Классификатор на основе градиентного бустинга был протестирован на исторических данных в рамках торгового моделирования с начальным капиталом в $10 000. За 49 сделок модель достигла доли прибыльных сделок в 40.82%. Однако моделирование привело к чистому убытку в размере $20 653.25. Это подчеркивает ключевой вывод: высокая точность определения направления не гарантирует автоматически прибыльности торговой стратегии, поскольку транзакционные издержки, проскальзывание и управление рисками (уровни стоп-лосс/тейк-профит, не упомянутые в PDF) играют решающую роль.

Описание графика (подразумеваемое): Линейный график, вероятно, показал бы снижение исторического курса USD/BDT примерно с 0.012 (2018) до 0.009 (2023). Второй график отобразил бы совокупную прибыль/убыток (P&L) торговой стратегии GBC, показывая первоначальный период роста, за которым следует резкое снижение, ведущее к конечному чистому убытку.

5. Техническое углубление

Эффективность LSTM заключается в ее состоянии ячейки и механизмах вентилей. Ключевые уравнения для ячейки LSTM на временном шаге $t$:

Вентиль забывания: $f_t = \sigma(W_f \cdot [h_{t-1}, x_t] + b_f)$
Входной вентиль: $i_t = \sigma(W_i \cdot [h_{t-1}, x_t] + b_i)$
Кандидат на состояние ячейки: $\tilde{C}_t = \tanh(W_C \cdot [h_{t-1}, x_t] + b_C)$
Обновление состояния ячейки: $C_t = f_t * C_{t-1} + i_t * \tilde{C}_t$
Выходной вентиль: $o_t = \sigma(W_o \cdot [h_{t-1}, x_t] + b_o)$
Выход скрытого состояния: $h_t = o_t * \tanh(C_t)$

Где $\sigma$ — сигмоидная функция, $*$ обозначает поэлементное умножение, $W$ и $b$ — веса и смещения, $x_t$ — вход, $h_t$ — скрытое состояние, а $C_t$ — состояние ячейки. Эта архитектура позволяет модели избирательно запоминать или забывать информацию в длинных последовательностях, что крайне важно для финансовых временных рядов с долгосрочными зависимостями.

6. Аналитическая структура и пример

Структура: Конвейер машинного обучения для Forex
Это исследование иллюстрирует стандартный, но эффективный конвейер для финансового ML:

  1. Формулировка задачи: Регрессия (LSTM для цены) против классификации (GBC для направления).
  2. Конструирование признаков: Создание прогнозных сигналов из исходных цен (доходность, технические индикаторы).
  3. Выбор и обучение модели: Выбор моделей, учитывающих последовательности (LSTM), для временных данных.
  4. Строгая валидация: Использование перекрестной проверки для временных рядов, а не случайного разбиения, чтобы избежать смещения предвидения.
  5. Бэктестинг стратегии: Преобразование прогнозов модели в смоделированную торговую стратегию с реалистичными ограничениями.

Пример: Генерация сигнала
Упрощенное правило на основе прогноза LSTM могло бы быть таким: «Если прогнозируемая цена на завтра > (сегодняшняя цена + порог $\alpha$), сгенерировать сигнал ПОКУПКИ». GBC напрямую выдает метку класса (1 для ВВЕРХ, 0 для ВНИЗ). Ключевой урок из торговых убытков в статье — необходимость последующего уровня управления рисками, который определяет размер позиции, стоп-лосс ордера и распределение портфеля, что, вероятно, отсутствовало или было упрощено в моделировании.

7. Будущие применения и направления

Будущее ИИ в прогнозировании Forex лежит в многомодальных, адаптивных системах:

  • Интеграция альтернативных данных: Включение анализа настроений новостей в реальном времени (с использованием NLP-моделей, таких как BERT), тональности коммуникаций центральных банков и индексов геополитических рисков, как это делается в хедж-фондах типа Two Sigma.
  • Гибридные модели и модели с механизмом внимания: Переход от стандартных LSTM к архитектурам Transformer с механизмами самовнимания (как в работе Вашвани и др. «Attention is All You Need»), которые могут более гибко взвешивать важность различных временных шагов.
  • Обучение с подкреплением (RL): Разработка RL-агентов, которые учатся оптимальным торговым политикам напрямую, учитывая издержки и доходность с поправкой на риск, а не просто прогнозируют цены. Это согласуется с исследованиями DeepMind и OpenAI в смоделированных средах.
  • Объяснимый ИИ (XAI): Внедрение таких методов, как SHAP или LIME, для интерпретации прогнозов модели, что крайне важно для соблюдения регуляторных требований и завоевания доверия финансовых институтов.
  • Межрыночное обучение: Обучение моделей на нескольких валютных парах или классах активов для изучения универсальных паттернов волатильности и заражения.

8. Список литературы

  1. Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. Neural Computation.
  2. Gers, F. A., Schmidhuber, J., & Cummins, F. (2000). Learning to Forget: Continual Prediction with LSTM.
  3. Rahman et al. (2022). LSTM-based Forecasting for Emerging Market Currencies: A USD/INR Case Study. Journal of Computational Finance.
  4. Afrin, S., et al. (2021). Forecasting USD/BDT Exchange Rate Using Machine Learning. International Conference on Computer and Information Technology.
  5. Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems.
  6. Yahoo Finance. (2023). USD/BDT Historical Data.

9. Взгляд отраслевого аналитика

Ключевой вывод: Эта статья — классический пример «парадокса точности-прибыльности» в количественных финансах. Авторы построили технически грамотную модель LSTM, которая достигает почти идеальной точности в 99.45% при прогнозировании USD/BDT — впечатляющий результат, — однако связанная с ней торговая стратегия привела к катастрофическим убыткам капитала. Реальная история не в точности модели; она в разительном несоответствии между оптимизацией академических метрик и реальной торговой прибылью/убытком. Это подчеркивает истину, которую многие кванты постигают на собственном горьком опыте: минимизация СКО — не то же самое, что максимизация коэффициента Шарпа.

Логическая последовательность: Исследование следует стандартному конвейеру: сбор данных, конструирование признаков, выбор модели (LSTM/GBC) и валидация производительности. Однако логический изъян заключается в скачке от валидации к применению. Бэктестинг кажется наивным, вероятно, ему не хватает надежного моделирования транзакционных издержек, проскальзывания и, что наиболее важно, последовательной структуры управления рисками. Процент выигрышных сделок в 40% при большом отрицательном чистом результате предполагает, что убытки на проигрышной сделке были намного больше, чем прибыль на выигрышной, — фатальный недостаток, который никакая точность LSTM не может исправить.

Сильные стороны и недостатки:

  • Сильные стороны: Отличная инженерия модели для нишевой, малоизученной валютной пары (USD/BDT). Сравнение с ARIMA предоставляет четкий ориентир. Явное упоминание торговых убытков является интеллектуально честным и более ценным, чем многие статьи, которые освещают только успехи.
  • Недостатки: Торговое моделирование по сути является запоздалой мыслью, что выявляет отсутствие интеграции между уровнями прогнозирования и исполнения — самой сути систематической торговли. Нет обсуждения определения размера позиции (например, критерий Келли), стоп-лоссов или контекста портфеля. Кроме того, хотя LSTM мощны, их характер «черного ящика» по-прежнему остается значительным барьером для внедрения в регулируемых финансовых институтах по сравнению с более интерпретируемыми ансамблями, такими как градиентный бустинг на деревьях.

Практические рекомендации:

  1. Преодолеть разрыв с помощью обучения с подкреплением: Вместо того чтобы рассматривать прогнозирование и торговлю как отдельные шаги, будущая работа должна использовать сквозное обучение с подкреплением (RL). RL-агент, подобный тем, что используются DeepMind для игр, может научиться оптимизировать прямые торговые метрики (например, совокупную доходность, коэффициент Сортино) на основе исходных данных, по своей сути учитывая издержки и риски.
  2. Принять триединство «Прогноз-Исполнение-Риск»: Любое прогнозное исследование должно оцениваться в рамках триады. Модель прогнозирования — лишь одна вершина. Равная строгость должна применяться к модели исполнения (влияние на рынок, издержки) и модели рисков (VaR, ожидаемый дефицит, контроль просадки).
  3. Сосредоточиться на определении режима: USD/BDT при управляемом плавании имеет различные режимы (стабильный, интервенционный, кризисный). Такие модели, как модели марковского переключения или алгоритмы кластеризации, должны использоваться для первоначального определения текущего режима, а затем применения наиболее подходящей прогнозной модели. Подход «одна модель для всего» близорук.
  4. Отдать приоритет объяснимости: Чтобы перейти от академического упражнения к инструменту трейдера, внедрите методы XAI. Показать трейдеру, что сигнал «продажа» на 60% обусловлен растущим торговым дефицитом и на 40% — дивергенцией RSI, создает гораздо больше доверия, чем «черный ящик» с точностью 99%.
В заключение, эта статья является твердым шагом в применении глубокого обучения к рынкам развивающихся стран. Однако ее наиболее значительный вклад — непреднамеренное выделение пропасти между отличным прогнозом и отличной сделкой. Следующий прорыв произойдет не от немного лучшей LSTM, а от целостной системы ИИ, которая понимает, что финансы — это управление неопределенностью и риском, а не просто прогнозирование чисел.