فهرست مطالب
1. مقدمه
این مقاله به شکاف مهمی در علوم بیمهای و ریاضیات مالی میپردازد: استراتژی سرمایهگذاری بهینه برای یک شرکت بیمه که در چندین بازار ارزی فعالیت میکند. مدلهای سنتی، مانند مدلهای براون (1995) و اشمیدلی (2002)، عمدتاً بر محیطهای تکارزی متمرکز هستند. با این حال، در یک اقتصاد جهانیشده، بیمهگران باید داراییها و بدهیهای ارزی مختلف را مدیریت کنند که آنها را در معرض ریسک ارزی قرار میدهد. این پژوهش، مدل کلاسیک مازاد کرامر-لوندبرگ را به یک محیط دو ارزی گسترش میدهد و نرخ ارز تصادفی را با استفاده از یک فرآیند اورنشتاین-اولنبک مدل میکند. هدف، بیشینهسازی مطلوبیت نمایی مورد انتظار ثروت نهایی است که یک معیار رایج ریسکگریزی در مالی بیمه است.
2. فرمولبندی مدل
2.1 فرآیند مازاد
فرآیند مازاد بیمهگر $R(t)$ با استفاده از تقریب انتشار مدل کلاسیک کرامر-لوندبرگ مدل میشود: $$dR(t) = c dt - d\left(\sum_{i=1}^{N(t)} Y_i\right) \approx (c - \lambda \mu_Y) dt + \sigma_R dW_R(t)$$ که در آن $c$ نرخ حق بیمه، $\lambda$ شدت وقوع خسارت، $\mu_Y$ میانگین اندازه خسارت و $W_R(t)$ یک حرکت براونی استاندارد است. این تقریب، فرآیند پوآسون مرکب را برای تحلیلپذیری ساده میکند که تکنیکی رایج در ادبیات موضوع است (برای مثال، گراندل، 1991 را ببینید).
2.2 بازار مالی
بیمهگر میتواند در موارد زیر سرمایهگذاری کند:
- دارایی بدون ریسک داخلی: $dB(t) = r_d B(t) dt$، با نرخ بهره $r_d$.
- دارایی ریسکی خارجی: با یک حرکت براونی هندسی مدل میشود: $dS_f(t) = \mu_f S_f(t) dt + \sigma_f S_f(t) dW_f(t)$.
2.3 دینامیک نرخ ارز
نرخ ارز $Q(t)$ (واحد پول داخلی به ازای هر واحد پول خارجی) و رانش آن به صورت زیر مدل میشود: $$dQ(t) = Q(t)[\theta(t) dt + \sigma_Q dW_Q(t)]$$ $$d\theta(t) = \kappa(\bar{\theta} - \theta(t)) dt + \sigma_\theta dW_\theta(t)$$ در اینجا، $\theta(t)$ نرخ رشد میانگین لحظهای است که از یک فرآیند OU پیروی میکند و ویژگی بازگشت به میانگین معمول نرخهای ارز را که تحت تأثیر عوامل کلان اقتصادی مانند تفاوت تورم و برابری نرخ بهره است، در بر میگیرد (فاما، 1984). $W_Q(t)$ و $W_\theta(t)$ حرکتهای براونی همبسته هستند.
3. مسئله بهینهسازی
3.1 تابع هدف
فرض کنید $X(t)$ کل ثروت به واحد پول داخلی باشد. بیمهگر مقدار $\pi(t)$ سرمایهگذاری شده در دارایی ریسکی خارجی را کنترل میکند. هدف، بیشینهسازی مطلوبیت نمایی مورد انتظار ثروت نهایی در زمان $T$ است: $$\sup_{\pi} \mathbb{E}[U(X(T))] = \sup_{\pi} \mathbb{E}\left[-\frac{1}{\gamma} e^{-\gamma X(T)}\right]$$ که در آن $\gamma > 0$ ضریب ثابت بیزاری مطلق از ریسک است. تابع مطلوبیت نمایی، معادله HJB را ساده میکند زیرا وابستگی به ثروت را در استراتژی بهینه تحت شرایط خاصی حذف میکند.
3.2 معادله همیلتون-ژاکوبی-بل
فرض کنید $V(t, x, \theta)$ تابع ارزش باشد. معادله HJB مرتبط به صورت زیر است: $$\sup_{\pi} \left\{ V_t + \mathcal{L}^{\pi} V \right\} = 0$$ با شرط پایانی $V(T, x, \theta) = U(x) = -\frac{1}{\gamma}e^{-\gamma x}$. عملگر دیفرانسیل $\mathcal{L}^{\pi}$ شامل دینامیک $X(t)$، $\theta(t)$ و همبستگیهای آنها میشود. حل این PDE چالش تحلیلی اصلی است.
4. حل تحلیلی
4.1 استراتژی سرمایهگذاری بهینه
مقاله، سرمایهگذاری بهینه در دارایی ریسکی خارجی را به صورت زیر استخراج میکند: $$\pi^*(t) = \frac{\mu_f + \theta(t) - r_d}{\gamma (\sigma_f^2 + \sigma_Q^2 + 2\rho_{fQ}\sigma_f\sigma_Q)} + \text{عبارات تعدیلکننده شامل } \theta(t)$$ این فرمول تفسیر شهودی دارد: عبارت اول یک جواب کلاسیک به سبک مرتون (1969) است، که در آن سرمایهگذاری متناسب با بازده اضافی ($\mu_f + \theta(t) - r_d$) و معکوس با ریسک ($\gamma$ و واریانس کل) است. عبارات تعدیلکننده، ماهیت تصادفی رانش نرخ ارز $\theta(t)$ و همبستگی آن با فرآیندهای دیگر را در نظر میگیرند.
4.2 تابع ارزش
تابع ارزش به شکل زیر یافت میشود: $$V(t, x, \theta) = -\frac{1}{\gamma} \exp\left\{-\gamma x e^{r_d (T-t)} + A(t) + B(t)\theta + \frac{1}{2}C(t)\theta^2 \right\}$$ که در آن $A(t)$، $B(t)$ و $C(t)$ توابع قطعی از زمان هستند که یک سیستم معادلات دیفرانسیل معمولی (معادلات ریکاتی) را ارضا میکنند. این ساختار در مسائل کنترل خطی-درجهدوم با تابع مطلوبیت نمایی رایج است.
5. تحلیل عددی
مقاله یک تحلیل عددی برای نشان دادن رفتار استراتژی بهینه ارائه میدهد. مشاهدات کلیدی شامل موارد زیر است:
- حساسیت به $\theta(t)$: سرمایهگذاری بهینه $\pi^*(t)$ زمانی که انتظار افزایش ارزش نرخ ارز $\theta(t)$ بالا باشد، افزایش مییابد و سرمایهگذاری در دارایی خارجی را تشویق میکند.
- تأثیر بیزاری از ریسک ($\gamma$): بیزاری بیشتر از ریسک، همانطور که انتظار میرود، موقعیت در دارایی ریسکی خارجی را به طور قابل توجهی کاهش میدهد.
- اثر همبستگی: همبستگی منفی بین بازده دارایی خارجی و تغییر نرخ ارز ($\rho_{fQ}$) میتواند به عنوان یک پوشش طبیعی عمل کند و امکان موقعیت بهینه بزرگتری را فراهم کند.
6. بینش کلیدی و دیدگاه تحلیلگر
بینش کلیدی: این مقاله فقط یک تغییر جزئی دیگر در مدل سرمایهگذاری بیمهگر نیست. مشارکت بنیادی آن، ادغام رسمی ریسک ارزی تصادفی در چارچوب مدیریت دارایی-بدهی بیمهگر است. با مدلکردن رانش نرخ ارز به عنوان یک فرآیند OU با بازگشت به میانگین، نویسندگان فراتر از مدلهای ساده با پارامترهای ثابت رفته و یک واقعیت کلیدی برای بیمهگران جهانی را در بر میگیرند: ریسک ارزی یک عامل پایدار و پویا است که باید بهطور فعال مدیریت شود، نه فقط یک هزینه تبدیل ثابت.
جریان منطقی: منطق، مستحکم و از الگوی استاندارد کنترل تصادفی پیروی میکند: (1) گسترش مازاد کرامر-لوندبرگ به یک انتشار، (2) اضافه کردن یک بازار دو ارزی با نرخ ارز تصادفی، (3) تعریف تابع هدف مطلوبیت نمایی، (4) استخراج معادله HJB، (5) استفاده از خاصیت تفکیکپذیری تابع مطلوبیت نمایی برای حدس زدن شکل جواب، و (6) حل معادلات ریکاتی حاصل. این مسیری شناختهشده اما مؤثر است، که در روح مشابه کار بنیادی فلمینگ و سونر (2006) در مورد انتشارهای کنترلشده است.
نقاط قوت و ضعف: نقاط قوت: زیبایی مدل، نقطه قوت اصلی آن است. ترکیب تابع مطلوبیت نمایی و دینامیک وابسته خطی برای $\theta(t)$ منجر به یک جواب بسته و قابل تحلیل میشود که در مسائل کنترل تصادفی نادر است. این امر، تحلیلهای مقایسهای واضحی ارائه میدهد. همچنین، گنجاندن صریح همبستگی بین بازده دارایی و ارز قابل تحسین است، زیرا تصدیق میکند که این ریسکها مجزا نیستند. نقاط ضعف: فرضیات مدل، نقطه ضعف آن است. تقریب انتشار مازاد بیمه، ریسک پرش (که ذات ادعاهای بیمه است) را حذف میکند و ممکن است ریسک دنباله را دستکم بگیرد. فرآیند OU برای $\theta(t)$، اگرچه دارای بازگشت به میانگین است، ممکن است «تغییرات رژیم ثابت» یا کاهش ارزش ناگهانی مشاهدهشده در بازارهای نوظهور را در بر نگیرد. علاوه بر این، مدل هزینههای معامله و محدودیتهایی مانند ممنوعیت فروش استقراضی را نادیده میگیرد که برای اجرای عملی حیاتی هستند. در مقایسه با رویکردهای قویتر مانند یادگیری تقویتی عمیق برای بهینهسازی سبد (Theate & Ernst, 2021)، این مدل از نظر تحلیلی مرتب به نظر میرسد اما در دنیای واقعی بالقوه شکننده است.
بینشهای قابل اجرا: برای مدیران ارشد سرمایهگذاری در بیمهگران جهانی، این پژوهش تأکید میکند که پوشش ریسک ارزی نمیتواند یک فکر بعدی باشد. استراتژی بهینه، پویا است و به وضعیت فعلی رانش نرخ ارز ($\theta(t)$) بستگی دارد که باید به طور مداوم برآورد شود. متخصصان باید: 1. موتورهای برآورد بسازند: فیلترهای کالمن قوی یا روشهای MLE را برای برآورد حالت پنهان $\theta(t)$ و پارامترهای آن ($\kappa, \bar{\theta}, \sigma_\theta$) در زمان واقعی توسعه دهند. 2. تست استرس فراتر از OU: از چارچوب مدل استفاده کنند اما فرآیند OU را با مدلهای پیچیدهتر (مانند مدلهای تغییر رژیم) در تحلیل سناریو جایگزین کنند تا تابآوری استراتژی را ارزیابی کنند. 3. تمرکز بر همبستگی: همبستگی ($\rho_{fQ}$) بین بازده دارایی خارجی و حرکتهای ارزی را بهطور فعال نظارت و مدل کنند، زیرا یک عامل تعیینکننده کلیدی نسبت پوشش و مواجهه بهینه است.
7. جزئیات فنی و چارچوب ریاضی
ماشینآلات ریاضی اصلی، معادله همیلتون-ژاکوبی-بل از نظریه کنترل بهینه تصادفی است. دینامیک ثروت به واحد پول داخلی، با در نظر گرفتن سرمایهگذاری $\pi(t)$ در دارایی خارجی، به صورت زیر است: $$dX(t) = \left[ r_d X(t) + \pi(t)(\mu_f + \theta(t) - r_d) + (c - \lambda\mu_Y) \right] dt + \pi(t)\sigma_f dW_f(t) + \pi(t)\sigma_Q dW_Q(t) + \sigma_R dW_R(t)$$ معادله HJB برای تابع ارزش $V(t,x,\theta)$ به صورت زیر است: $$ \begin{aligned} 0 = \sup_{\pi} \Bigg\{ & V_t + \left[ r_d x + \pi(\mu_f + \theta - r_d) + (c - \lambda\mu_Y) \right] V_x + \kappa(\bar{\theta} - \theta) V_\theta \\ & + \frac{1}{2}\left( \pi^2(\sigma_f^2 + \sigma_Q^2 + 2\rho_{fQ}\sigma_f\sigma_Q) + \sigma_R^2 + 2\pi(\rho_{fR}\sigma_f\sigma_R + \rho_{QR}\sigma_Q\sigma_R) \right) V_{xx} \\ & + \frac{1}{2}\sigma_\theta^2 V_{\theta\theta} + \pi \sigma_\theta (\rho_{f\theta}\sigma_f + \rho_{Q\theta}\sigma_Q) V_{x\theta} \Bigg\} \end{aligned} $$ فرض تابع مطلوبیت نمایی $V(t,x,\theta) = -\frac{1}{\gamma}\exp\{-\gamma x e^{r_d(T-t)} + \phi(t,\theta)\}$ این را به یک PDE برای $\phi(t,\theta)$ ساده میکند که با حدس درجهدوم $\phi(t,\theta)=A(t)+B(t)\theta+\frac{1}{2}C(t)\theta^2$ منجر به معادلات ریکاتی برای $A(t), B(t), C(t)$ میشود.
8. چارچوب تحلیل: یک مورد عملی
سناریو: یک بیمهگر غیرزندگی ژاپنی (واحد پول داخلی: ین ژاپن) مازاد حاصل از عملیات داخلی خود را نگه میدارد. این شرکت در حال بررسی سرمایهگذاری بخشی از داراییهای خود در سهام فناوری ایالات متحده (دارایی خارجی، دلار آمریکا) است. هدف، تعیین تخصیص پویای بهینه به این دارایی خارجی در یک افق 5 ساله است.
کاربرد چارچوب:
- کالیبراسیون پارامترها:
- مازاد (ین): $c$، $\lambda$، $\mu_Y$ را از دادههای تاریخی خسارت برآورد کنید تا رانش $(c-\lambda\mu_Y)$ و نوسان $\sigma_R$ به دست آید.
- سهام فناوری ایالات متحده (دلار): بازده مورد انتظار $\mu_f$ و نوسان $\sigma_f$ را از یک شاخص معیار (مانند Nasdaq-100) برآورد کنید.
- نرخ ارز USD/JPY: از دادههای تاریخی برای کالیبره کردن پارامترهای فرآیند OU برای $\theta(t)$ استفاده کنید: میانگین بلندمدت $\bar{\theta}$، سرعت بازگشت به میانگین $\kappa$ و نوسان $\sigma_\theta$. همبستگیها ($\rho_{fQ}, \rho_{fR},$ و غیره) را برآورد کنید.
- نرخهای بدون ریسک: از بازده اوراق قرضه دولتی ژاپن برای $r_d$ و بازده خزانهداری ایالات متحده (تبدیل شده به ساختار مدل) استفاده کنید.
- بیزاری از ریسک: $\gamma$ را بر اساس کفایت سرمایه و تحمل ریسک شرکت تنظیم کنید.
- محاسبه استراتژی: پارامترهای کالیبره شده را در فرمول $\pi^*(t)$ قرار دهید. این امر مستلزم مقدار فعلی برآورد شده حالت پنهان $\theta(t)$ است که میتواند از حرکتهای اخیر نرخ ارز فیلتر شود.
- خروجی و نظارت: مدل، یک درصد تخصیص هدف متغیر با زمان را خروجی میدهد. خزانهداری بیمهگر، نسبت پوشش ارزی و تخصیص سهام خود را بر این اساس تنظیم میکند. برآورد $\theta(t)$ باید به طور دورهای (مثلاً ماهانه) بهروزرسانی شود که منجر به تعدیل مجدد پویا میشود.
9. کاربردهای آتی و جهتهای پژوهشی
این مدل، چندین مسیر را برای گسترش و کاربرد عملی باز میکند:
- سبدهای چندارزی: گسترش مدل به بیش از یک واحد پول خارجی و دارایی، مدیریت شبکهای از همبستگیهای بینارزی. این امر با نیازهای بیمهگران چندملیتی همسو است.
- گنجاندن ریسکهای پرش: جایگزینی تقریب انتشار با یک فرآیند پرش-انتشار یا لوی واقعبینانهتر برای مازاد بیمه، برای مدلسازی بهتر خسارتهای فاجعهبار، با استفاده از تکنیکهای سوریا (2022) در مورد کنترل بهینه تحت فرآیندهای پرش.
- مدلهای تغییر رژیم: مدلکردن $\theta(t)$ یا پارامترهای بازار با یک فرآیند تغییر رژیم مارکوف، برای در بر گرفتن چرخههای مختلف سیاست پولی یا اقتصادی، همانطور که در آثار الیوت و همکاران دیده میشود.
- ادغام یادگیری ماشین: استفاده از شبکههای LSTM یا عاملهای یادگیری تقویتی برای برآورد حالت پنهان $\theta(t)$ و دینامیک آن از دادههای بازار با فرکانس بالا، فراتر از فرض پارامتری OU.
- ادغام ALM: تعبیه این مدل سرمایهگذاری در یک چارچوب گستردهتر مدیریت دارایی-بدهی که بر قیمتگذاری محصولات بیمه و استراتژیهای بیمه اتکایی نیز بهینهسازی میکند.
- مالی غیرمتمرکز: اعمال مدل برای مدیریت خزانه یک پروتکل بیمه غیرمتمرکز (مانند Nexus Mutual) که داراییهای رمزارزی را در چندین واحد پول بومی بلاکچین نگه میدارد، جایی که نوسان نرخ ارز شدید است.
10. مراجع
- Browne, S. (1995). Optimal Investment Policies for a Firm with a Random Risk Process: Exponential Utility and Minimizing the Probability of Ruin. Mathematics of Operations Research, 20(4), 937-958.
- Fama, E. F. (1984). Forward and spot exchange rates. Journal of Monetary Economics, 14(3), 319-338.
- Fleming, W. H., & Soner, H. M. (2006). Controlled Markov Processes and Viscosity Solutions (2nd ed.). Springer.
- Grandell, J. (1991). Aspects of Risk Theory. Springer-Verlag.
- Merton, R. C. (1969). Lifetime Portfolio Selection under Uncertainty: The Continuous-Time Case. The Review of Economics and Statistics, 51(3), 247-257.
- Schmidli, H. (2002). On minimizing the ruin probability by investment and reinsurance. The Annals of Applied Probability, 12(3), 890-907.
- Surya, B. A. (2022). Optimal investment and reinsurance for an insurer under jump-diffusion models. Scandinavian Actuarial Journal, 2022(5), 401-429.
- Theate, T., & Ernst, D. (2021). An Application of Deep Reinforcement Learning to Algorithmic Trading. Expert Systems with Applications, 173, 114632.
- Zhou, Q., & Guo, J. (2020). Optimal Control of Investment for an Insurer in Two Currency Markets. arXiv preprint arXiv:2006.02857.