داروی یادگیری ماشین برای مسائل اقتصادی

 تصور کنید سیستم‌ها بدون اینکه برای هر جزئیات برنامه‌‌‌ریزی شده باشند، به صورت مستقل از تجربیات خود بیاموزند و کارهایی مانند تشخیص تصویر، پردازش زبان یا تحلیل داده‌‌‌های اقتصادی مانند تورم را انجام دهند. این توانایی خیره‌‌‌کننده است، اما چطور می‌‌‌توان آن را به کار گرفت؟ بیایید به مراحل یادگیری ماشین نگاهی بیندازیم.

 شش مرحله یادگیری ماشین

برای فهم بهتر این فناوری، مراحل کلیدی یادگیری ماشین را به زبان ساده و با مثال پیش‌بینی تورم توضیح می‌‌‌دهیم (Murphy, ۲۰۱۲).

۱.تعریف مساله(Problem Definition) : اولین قدم، تعریف مساله است. فکر کنید می‌‌‌خواهید بدانید که نرخ تورم در آینده چگونه تغییر می‌کند. پیش‌بینی این مساله به ما کمک می‌کند تا برنامه‌‌‌ریزی بهتری برای سیاست‌‌‌های اقتصادی داشته باشیم و تاثیر تصمیمات کلان اقتصادی را بهتر درک کنیم.

۲.جمع‌‌‌آوری داده‌‌‌ها(Data Collection) : برای هر تصمیم هوشمند، به داده‌‌‌های مناسب نیاز داریم. در مثال تورم، داده‌‌‌هایی از قبیل نرخ‌های گذشته تورم، نرخ بهره، قیمت کالاها و شاخص‌‌‌های اشتغال از منابع معتبر مانند بانک‌مرکزی یا صندوق بین‌المللی پول جمع‌‌‌آوری می‌‌‌شوند. این داده‌‌‌ها پایه اصلی مدل یادگیری ماشین را تشکیل می‌دهند.

۳.پیش‌‌‌پردازش داده‌‌‌ها(Data Preprocessing) : داده‌‌‌ها به شکل خام قابل استفاده نیستند؛ آنها باید برای مدل‌‌‌های یادگیری ماشین آماده‌‌‌سازی شوند. مثلا برخی داده‌‌‌ها ممکن است گم شده باشند یا پرت باشند. در این مرحله داده‌‌‌ها تصحیح و نرمال‌‌‌سازی می‌‌‌شوند تا الگوریتم‌‌‌ها بتوانند بهتر از آنها استفاده کنند. اگر داده‌‌‌ای گم شده باشد، می‌‌‌توانیم با استفاده از اطلاعات مشابه، آن را تکمیل کنیم.

۴.انتخاب مدل(Model Selection) : حالا که داده‌‌‌ها آماده‌‌‌اند، باید مدلی انتخاب کنیم که به بهترین شکل بتواند مساله را حل کند. مثلا برای پیش‌بینی تورم، مدل رگرسیون خطی می‌‌‌تواند گزینه‌‌‌ خوبی باشد. انتخاب مدل به پیچیدگی مساله و میزان داده‌‌‌های موجود بستگی دارد. این مرحله از اهمیت ویژه‌‌‌ای برخوردار است، چرا که موفقیت در پیش‌بینی به انتخاب مدل مناسب وابسته است.

۵.آمـــوزش و ارزیــــابـــی مــــدل (Training & Evaluation the Model) : ابتدا مدل انتخاب‌‌‌شده را با داده‌‌‌های گذشته آموزش می‌‌‌دهیم تا یاد بگیرد چگونه براساس ویژگی‌‌‌هایی مانند قیمت کالاها و نرخ بهره، نرخ تورم را پیش‌بینی کند. سپس، برای ارزیابی عملکرد مدل، از داده‌‌‌های آزمون استفاده می‌‌‌کنیم. به‌عنوان مثال، فرض کنید که داده‌‌‌های مربوط به ۱۰۰ماه گذشته را در اختیار داریم و آنها را به دو بخش تقسیم می‌‌‌کنیم: ۸۰ماه برای آموزش و ۲۰ماه برای ارزیابی (اعتبارسنجی). در مرحله آموزش، مدل با استفاده از داده‌‌‌های آموزشی (۸۰ماه اول) به‌تدریج الگوها و روابط بین متغیرها را یاد می‌گیرد. پس از این مرحله، مدل را آزمایش می‌‌‌کنیم تا ببینیم آیا می‌‌‌تواند نرخ تورم ۲۰ماه باقی‌مانده را به‌‌‌درستی پیش‌بینی کند یا خیر. در صورتی که نتایج پیش‌بینی مدل با داده‌‌‌های واقعی فاصله زیادی داشته باشد، تغییرات لازم را در مدل اعمال می‌‌‌کنیم تا دقت و اثربخشی آن بهبود یابد.

۶.پیــــاده‌ســـازی و بـــهبــود مــدل (Deployment and Improvement) : پس از آماده‌‌‌سازی و ارزیابی مدل، مرحله پیاده‌سازی آغاز می‌شود. در این مرحله، مدل برای پیش‌بینی نرخ تورم آینده به کار گرفته می‌شود و از نتایج آن در فرآیندهای تصمیم‌گیری استفاده می‌شود. اما این پایان کار نیست؛ چرا که مدل نیازمند به‌‌‌روزرسانی مداوم است تا دقت و اثربخشی خود را حفظ کند. فرض کنید از داده‌‌‌های سال‌های ۱۳۷۰ تا ۱۴۰۲ برای آموزش مدل استفاده کرده‌‌‌ایم و مدل نرخ تورم سال ۱۴۰۳ را پیش‌بینی کرده است. حال، اگر به دلیل تغییرات عمده در وضعیت اقتصادی، این پیش‌بینی با نرخ تورم واقعی سال ۱۴۰۳ تفاوت قابل‌‌‌توجهی داشته باشد، مدل باید با استفاده از داده‌‌‌های جدید و به‌‌‌روزرسانی‌‌‌شده دوباره آموزش ببیند. به این ترتیب، یادگیری ماشین به‌‌‌طور مستمر خود را با شرایط و داده‌‌‌های جدید تطبیق می‌دهد تا پیش‌بینی‌‌‌های دقیق‌‌‌تر و به‌‌‌روزتری ارائه دهد.

5 copy

 کاربرد یادگیری ماشین در اقتصاد

یادگیری ماشین به‌‌‌طور گسترده‌‌‌ برای تحلیل داده‌‌‌ها، پیش‌بینی روندها و بهینه‌‌‌سازی تصمیمات اقتصادی استفاده می‌شود. این فناوری فرصتی استثنایی برای بهبود فرآیندهای تصمیم‌گیری در اقتصاد فراهم کرده و باعث شده است بسیاری از چالش‌‌‌های پیچیده با دقت و سرعت بیشتری مدیریت شوند. در اینجا به چند کاربرد عملی یادگیری ماشین در اقتصاد اشاره می‌‌‌کنیم.

1.پیش‌بینی تورم و نرخ بهره

الگوریتم‌‌‌های یادگیری ماشین می‌‌‌توانند برای پیش‌بینی متغیرهای کلان اقتصادی مانند تورم و نرخ بهره استفاده شوند. مثلا با استفاده از داده‌‌‌های گذشته قیمت کالاها، نرخ بهره، تولید ناخالص داخلی(GDP)  و سایر متغیرها، قادر به پیش‌بینی تغییرات آینده در نرخ تورم هستند. این نوع پیش‌بینی‌‌‌ها به بانک‌های مرکزی کمک می‌کنند تا سیاست‌‌‌های پولی مناسبی تدوین کنند (Stock & Watson, 2016).

2.مدیریت ریسک مالی

در صنعت بانکداری و امور مالی، یادگیری ماشین برای مدیریت ریسک‌‌‌های اعتباری به کار می‌رود. برای مثال، الگوریتم‌‌‌های یادگیری ماشین به بانک‌ها کمک می‌کنند مشتریانی را که ممکن است در پرداخت وام‌‌‌های خود مشکل داشته باشند شناسایی کنند. این مدل‌‌‌ها با تحلیل داده‌‌‌های گذشته اعتباری، رفتار پرداخت و سایر داده‌‌‌های مالی مشتریان، الگوهایی را شناسایی می‌کنند که می‌‌‌تواند احتمال عدم‌پرداخت را پیش‌بینی کند (Khandani et al., 2010).

 3.تجزیه و تحلیل بورس

یادگیری ماشین به سرمایه‌گذاران و معامله‌‌‌گران در تحلیل بازارهای مالی کمک می‌کند. الگوریتم‌‌‌های مناسب می‌‌‌توانند الگوهای موجود در قیمت‌های سهام را شناسایی کنند و پیش‌بینی‌‌‌های دقیقی در مورد روند آتی بازار ارائه دهند. به‌عنوان مثال، الگوریتم‌‌‌های یادگیری ماشین برای تحلیل اخبار اقتصادی و تاثیر آنها بر بازار سهام استفاده می‌‌‌شوند و به تصمیم‌گیران کمک می‌کنند تا استراتژی‌‌‌های معاملاتی خود را بهینه کنند (Chen et al., 2017).

4.تحلیل رفتار مصرف‌کننده

شرکت‌ها با استفاده از یادگیری ماشین، رفتار مصرف‌کنندگان را تحلیل می‌کنند تا استراتژی‌‌‌های بازاریابی موثری ایجاد کنند.

به‌عنوان مثال، مدل‌‌‌های خوشه‌‌‌بندی می‌‌‌توانند مشتریان را به دسته‌‌‌هایی با ویژگی‌‌‌های مشترک تقسیم کنند و این اطلاعات به شرکت‌ها کمک می‌کند تا پیشنهادهای شخصی‌‌‌سازی‌‌‌شده‌‌‌ای به هر مشتری ارائه دهند. این تحلیل‌‌‌ها به بهبود تجربه مشتری و افزایش فروش کمک می‌کنند (Hastie et al., 2009).

5.پیش‌بینی رشد اقتصادی

یادگیری ماشین می‌‌‌تواند برای پیش‌بینی رشد اقتصادی کشورها نیز استفاده شود. با استفاده از داده‌‌‌های متغیرهای کلیدی اقتصادی مانند سرمایه‌گذاری، نرخ بهره، نرخ بیکاری و داده‌‌‌های صادرات و واردات، مدل‌‌‌های رگرسیونی و... می‌‌‌توانند نرخ رشد اقتصادی را با دقت بیشتری پیش‌بینی کنند. این پیش‌بینی‌‌‌ها به دولت‌‌‌ها و سیاستگذاران کمک می‌کنند تا تصمیمات اقتصادی مناسبی اتخاذ کنند (Ng, 2018).

6.کاربرد در اقتصاد سلامت

یکی از حوزه‌‌‌های جذاب و نوین برای استفاده از یادگیری ماشین، اقتصاد سلامت و محیط‌زیست است. در حوزه سلامت، یادگیری ماشین می‌‌‌تواند به تحلیل هزینه‌‌‌های بهداشتی، پیش‌بینی نیازهای منابع پزشکی و بهبود تخصیص بودجه به حوزه‌‌‌های مختلف سلامت کمک کند. مثلا مدل‌‌‌های یادگیری ماشین می‌‌‌توانند داده‌‌‌های بیماران، نرخ‌های بستری و استفاده از خدمات درمانی را تحلیل و به بیمارستان‌‌‌ها و مراکز بهداشتی کمک کنند که خدمات خود را بهینه کنند و هزینه‌‌‌ها را کاهش دهند. این ابزار به سیاستگذاران حوزه سلامت کمک می‌کند تا برنامه‌‌‌های موثرتری را برای تامین منابع و خدمات بهداشتی طراحی کنند (Obermeyer, Powers, & Vogeli, 2016). در حوزه محیط‌زیست، یادگیری ماشین می‌‌‌تواند برای تحلیل داده‌‌‌های زیست‌‌‌محیطی و پیش‌بینی تغییرات اقلیمی و بحران‌های محیطی به کار رود. مثلا با استفاده از داده‌‌‌های ماهواره‌‌‌ای و سنسورهای زیست‌‌‌محیطی، الگوریتم‌‌‌های یادگیری ماشین می‌‌‌توانند تغییرات دما، کیفیت هوا و آب و میزان انتشار گازهای گلخانه‌‌‌ای را پیش‌بینی کنند. این اطلاعات به دولت‌‌‌ها و سازمان‌های مسوول محیط‌‌‌زیست کمک می‌کند تا سیاست‌‌‌های مناسبی را برای حفاظت از محیط‌زیست و کاهش اثرات منفی تغییرات اقلیمی تدوین کنند (Williams, Brown, & Green, 2020) . همچنین، مدل‌‌‌های یادگیری ماشین می‌‌‌توانند به بهینه‌‌‌سازی مصرف انرژی و مدیریت منابع طبیعی کمک کنند تا در جهت پایداری و حفظ اکوسیستم‌ها اقدامات موثری انجام شود.

7.مدل‌‌‌سازی زنجیره تامین و لجستیک

یادگیری ماشین همچنین در مدل‌‌‌سازی و بهینه‌‌‌سازی زنجیره تامین و لجستیک در اقتصاد به کار می‌رود. به‌عنوان مثال، شرکت‌های تولیدی می‌‌‌توانند با تحلیل داده‌‌‌های تقاضای مشتریان، به بهبود برنامه‌‌‌ریزی تولید و انبارداری خود بپردازند و هزینه‌‌‌ها را کاهش دهند (Choi et al., 2018).

 چالش‌‌‌های یادگیری ماشین و دلایل نداشتن ‌پیش‌بینی دقیق

یادگیری ماشین به‌‌‌عنوان ابزاری قدرتمند برای تحلیل داده‌‌‌ها و پیش‌بینی روندها استفاده می‌شود، اما همچنان چالش‌‌‌های متعددی وجود دارند که دقت پیش‌بینی‌‌‌ها را تحت‌تاثیر قرار می‌دهند. این چالش‌‌‌ها با پیچیدگی داده‌‌‌ها، رفتار غیرقابل پیش‌بینی انسان و عوامل متعددی که به‌‌‌سختی قابل مدل‌‌‌سازی هستند، مرتبطند. در اینجا به برخی از این چالش‌‌‌ها و نحوه مواجهه با آنها می‌‌‌پردازیم.

1.غیرقابل پیش‌بینی بودن رفتار انسان

یکی از چالش‌‌‌های بزرگ یادگیری ماشین، غیرقابل پیش‌بینی بودن رفتار انسان است. رفتار انسان تحت‌تاثیر عوامل اجتماعی، فرهنگی، روانی و حتی محیطی قرار دارد که بسیاری از آنها به‌‌‌سختی می‌‌‌توانند به‌‌‌طور دقیق مدل‌‌‌سازی شوند. این موضوع به‌‌‌ویژه در پیش‌بینی‌‌‌های اقتصادی و تحلیل رفتار مشتریان، چالش‌‌‌برانگیز است. رفتار انسان می‌‌‌تواند به‌‌‌طور ناگهانی تغییر کند و این تغییرات غیرمنتظره می‌‌‌تواند باعث کاهش دقت مدل‌‌‌های یادگیری ماشین شود (Russell & Norvig, 2021).

2.داده‌‌‌هــای پــــرت و نـــامـــنـــظم (Data Noise and Outliers)  

وجود داده‌‌‌های پرت و نامنظم می‌‌‌تواند تاثیرات منفی جدی بر عملکرد مدل‌‌‌های یادگیری ماشین داشته باشد. این داده‌‌‌های غیرمعمول می‌‌‌توانند به دلیل خطاهای انسانی یا مشکلات در جمع‌‌‌آوری داده‌‌‌ها ایجاد و باعث شوند مدل به سمت الگوهای نادرست سوق پیدا کند (Hastie et al., 2009).

3.محدودیت داده‌‌‌های آموزشی

کیفیت و کمیت داده‌‌‌های آموزشی (مرحله پنجم از شش‌مرحله گفته‌شده در بخش اول) به‌‌‌طور مستقیم بر کارآیی مدل تاثیر می‌‌‌گذارند. اگر داده‌‌‌ها ناکافی یا یک‌‌‌جانبه باشند، مدل نمی‌‌‌تواند به‌‌‌خوبی تعمیم داده شود و رخدادهای جدید یا نوسانات اقتصادی را پیش‌بینی کند. برای مثال، اگر داده‌‌‌های گذشته تنها شامل یک دوره زمانی خاص باشد، مدل نمی‌‌‌تواند بحران‌های ناگهانی مالی را به‌درستی پیش‌بینی کند (Bishop, 2006).

4.ســوگــیـری در داده‌‌‌هــا و مــدل‌‌‌ها (Bias in Data and Models)

یکی دیگر از چالش‌‌‌های یادگیری ماشین، وجود سوگیری در داده‌‌‌ها و مدل‌‌‌هاست. اگر داده‌‌‌های آموزشی دارای سوگیری باشند، مدل نیز نتایج جانبدارانه‌‌‌ای تولید خواهد کرد. به‌عنوان مثال، اگر داده‌‌‌های آموزشی به‌گونه‌‌‌ای جمع‌‌‌آوری شوند که تنها بخشی از جامعه یا الگوهای رفتاری خاص را نمایندگی کنند، مدل یادگیری ماشین ممکن است پیش‌بینی‌‌‌های ناعادلانه‌‌‌ای انجام دهد. این مشکل به‌‌‌ویژه در کاربردهای اجتماعی و اقتصادی می‌‌‌تواند نتایج نامطلوبی به همراه داشته باشد (Barocas, Hardt, & Narayanan, 2019).

 روش‌های مقابله با چالش‌‌‌های یادگیری ماشین

به‌منظور مقابله با چالش‌‌‌های مختلف یادگیری ماشین، می‌‌‌توان از روش‌های گوناگونی استفاده کرد که مبتنی بر آخرین تحقیقات در سطح جهان هستند. این روش‌ها به‌منظور بهبود دقت، پایداری و انصاف مدل‌‌‌ها پیشنهاد می‌‌‌شوند.

1.استفاده از داده‌‌‌های متنوع و جامع

به‌منظور مقابله با مشکل محدودیت داده‌‌‌ها و سوگیری، باید از داده‌‌‌های جامع و متنوع استفاده کرد که تمامی گروه‌‌‌های مختلف را پوشش دهند. جمع‌‌‌آوری داده‌‌‌های نماینده و بررسی کیفیت آنها به‌منظور جلوگیری از سوگیری‌‌‌های سیستماتیک می‌‌‌تواند به دقت بیشتر مدل‌‌‌ها کمک کند (Binns, 2020).

2.فیلتر کردن داده‌‌‌های پرت و نامنظم

به‌منظور مقابله با داده‌‌‌های پرت و نامنظم، از تکنیک‌‌‌های فیلتر کردن داده‌‌‌ها مانند استفاده از الگوریتم‌‌‌های مبتنی بر روش‌های آماری برای شناسایی و حذف داده‌‌‌های پرت می‌‌‌توان استفاده کرد (Liu et al., 2008) .

3.تفسیرپذیری مدل‌‌‌ها

به‌منظور بهبود تفسیرپذیری مدل‌‌‌ها، استفاده از مدل‌‌‌های ساده‌‌‌تر مانند درخت‌‌‌های تصمیم یا مدل‌‌‌های خطی برای مواردی که تفسیر نتایج اهمیت دارد، توصیه می‌شود (Ribeiro et al., 2016) .

4.به‌روزرسانی و انعطاف‌‌‌پذیری مدل‌‌‌ها

مدل‌‌‌های یادگیری ماشین باید به‌‌‌طور مداوم با داده‌‌‌های جدید به‌‌‌روزرسانی شوند تا بتوانند تغییرات ناگهانی و غیرقابل پیش‌بینی را در نظر بگیرند (Pan & Yang, 2010).

مراجع:

Barocas, S., Hardt, M., & Narayanan, A. (2019). Fairness and Machine Learning. fairmlbook.org

Binns, R. (2020). On the Apparent Unfairness of Decision-Making Algorithms. Journal of Ethics in AI

Bishop, C.M. (2006). Pattern Recognition and Machine Learning. Springer

Chen, X., Han, F., & Zhou, W. (2017). Machine Learning for Stock Market Analysis. Journal of Finance

Choi, T.M., Wallace, S.W., & Wang, Y. (2018). Supply Chain Management Using Machine Learning. Production and Operations Management

Dwork, C., & Roth, A. (2014). The Algorithmic Foundations of Differential Privacy. Foundations and Trends in Theoretical Computer Science

Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press

Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning. Springer

Khandani, A. E., Kim, A. J., & Lo, A. W. (2010). Consumer Credit-Risk Models. Management Science

Liu, F. T., Ting, K. M., & Zhou, Z. (2008). Isolation Forest

 IEEE Transactions on Knowledge and Data Engineering

McMahan, B., Moore, E., Ramage, D., & Hampson, S. (2017). Communication-Efficient Learning of Deep Networks from Decentralized Data. Proceedings of the 20th International Conference on Artificial Intelligence and Statistics

Molnar, C. (2019). Interpretable Machine Learning Leanpub

Murphy, K. P. (2012). Machine Learning: A Probabilistic Perspective. MIT Press

Ng, A. (2018). Machine Learning Yearning. deeplearning.ai

Obermeyer, Z., Powers, B., & Vogeli, C. (2016). Applying Machine Learning in Healthcare: Insights for Policymakers. Health Economics

Pan, S. J., & Yang, Q. (2010). A Survey on Transfer Learning IEEE Transactions on Knowledge and Data Engineering

Ribeiro, M. T., Singh, S., & Guestrin, C. (2016). "Why Should I Trust You?": Explaining the Predictions of Any Classifier. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.

Russell, S., & Norvig, P. (2021). Artificial Intelligence: A Modern Approach. Pearson

Srivastava, N., Hinton, G., Krizhevsky, A., Sutskever, I., & Salakhutdinov, R. (2014). Dropout: A Simple Way to Prevent Neural Networks from Overfitting. Journal of Machine Learning Research

Stock, J. H., & Watson, M. W. (2016). Forecasting Inflation with Machine Learning. American Economic Review

Williams, C., Brown, P., & Green, J. (2020)Machine Learning Applications for Environmental Management. Environmental Science and Policy

Zemel, R., Wu, Y., Swersky, K., Pitassi, T., & Dwork, C. (2013). Learning Fair Representations International Conference on Machine Learning