در سخنرانی دکتر سیدمحمد طبیبیان در آکادمی دانایان ارائه شد
کاربرد «یادگیریماشینی» در اقتصاد
طبیبیان در تعریف یادگیری ماشینی (ML) آن را راهی برای آموزش کامپیوترها دانست که چگونه از دادههای خود ظرفیت تصمیمگیری یا استنتاج بیابد. یادگیری ماشینی زیرمجموعه هوشمصنوعی (AI) است که با توسعه الگوریتمها و مدلها، کامپیوتر از دادهها یادگرفته و پیشبینی میکند یا تصمیم میگیرد. این شیوه مانند سیستمهای یادگیری گذشته به شکل برنامهنویس کامپیوتری نیست، بلکه کامپیوتر الگوها و روابط دادهها را از طریق فرآیندهای ریاضی و محاسباتی خاصی فرا میگیرد؛ هوشمندی کامپیوتر از دو مأخذ حاصل میشود که یکدیگر را تقویت میکنند: یکی ساختاری است که الگوی ریاضی و محاسبات بهینه بر دادهها اعمال میکنند و دیگری محتوای اطلاعاتی دادههاست.
اصلاحات مهم
این اقتصاددان در ادامه چند اصطلاح در یادگیری ماشینی را توضیح داد: نخست اینکه feature در یادگیری ماشینی به همان معنای «متغیر» در اقتصادسنجی است؛ یعنی اصطلاحات «ویژگی» و «متغیر» اغلب به جای یکدیگر برای اشاره به متغیرهای ورودی مدل بهکار میروند. بهعنوان مثال، در ساخت مدلی برای اعطای وام مسکن، مشخصات افراد شامل جنسیت سرپرست خانوار یا متقاضی، تعداد اعضای خانواده، مالکیت تعداد خودروی خانواده، نوع شغل، درآمد، سن و... است. در زمینه یادگیری ماشینی، از متغیرها اغلب برای اشاره به ستونهایی در مجموعه دادهها استفاده میشود؛ ویژگیها میتوانند عددی (بهعنوان مثال، سن یا تعداد خودرو) یا مقولهای (به عنوان مثال، نوع شغل یا جنسیت) باشند.
اصطلاح دیگر مفهوم بردارهای حامی است. این بردارها از محاسبات ماشین حاصل میشوند و در محاسبه معادله صفحهای که دادهها را دو قسمت میکنند یا منحنی و رابطهای که دادهها را چند قسمت میکنند، به کار گرفته میشوند. در یادگیری ماشینی، تفسیر این بردارها، ساختار پاسخ را برای پژوهشگر مهیا میکند. مفهوم دیگری که قابلتوجه است و از اقتصاد وارد این رشته شده، مفهوم «ارزش شپلی» است. این مفهوم کمک میکند که ارزش هر کدام از ویژگیها یا متغیرها را در مجموع محاسبات تعیین کنیم یا ارزش هر ویژگی را برای تبیین هرکدام از مشاهدات محاسبه کنیم. ارزش شپلی نقش اساسی در توضیحپذیری نتایج دارد.
این امر از الزاماتی است که امروزه از برونریزهای هوش مصنوعی مطالبه میشود و اتحادیه اروپا خصوصا بر ضرورت توضیحپذیری این سیستمها تاکید دارد. محاسبه ارزش شپلی در این مورد بسیار کارساز است. هر ویژگی (یا متغیر) دارای مقادیر متناظر برای هر نمونه در مجموعه داده است. در یک مجموعه داده، هر ردیف معمولا یک نمونه یا مشاهده فردی را نشان میدهد (بهعنوان مثال، یک وام) و هر ستون نشاندهنده یک ویژگی (بهعنوان مثال سن، درآمد، یا جنسیت) است. مقادیرِ درون ستونها، اندازهگیریها (ارزشها) را برای هر نمونه ارائه میکنند.
در طول مرحله آموزش مدل، الگوریتم یاد میگیرد این مقادیر را با متغیر هدف (نتیجهای که میخواهیم پیشبینی کنیم) مرتبط کند و به مدل اجازه تعمیم و پیشبینی دادههای جدید را بدهد. طبیبیان اصطلاحSVM) Support Vector Machine) را این گونه توضیح داد: الگوریتم قدرتمند یادگیری ماشینی است که برای کارهای طبقهبندی، بهویژه برای طبقهبندیهای دوتایی (باینری) استفاده میشود؛ جایی که هدف، جداسازی نقاط داده به دو گروه مجزا براساس ویژگیهای آنهاست. کار SVM یافتن ابرصفحهای است که نقاط داده گروههای مختلف را به بهترین نحو از هم جدا میکند، بهگونهایکه حاشیه بین گروهبندیها را حداکثر کند. حاشیه مورد اشاره فاصله بین این صفحه و نزدیکترین نقاط داده در هر گروه است.
به این نزدیکترین نقاط داده به ابرصفحه «بردارهای پشتیبان» Support Vectors میگویند که بیشترین تاثیر را در تعیین حاشیه و مرز تصمیم دارند. در فضای دو بعدی، ابرصفحه خطی است که نقاط داده دو گروهبندی را از هم جدا میکند. در فضاهای با ابعاد بیشتر، ابرصفحه به مرز تصمیمگیری خطی تبدیل میشود. گفتیم که «حاشیه» فاصله بین ابرصفحه و نزدیکترین نقاط داده از هر گروهبندی است. هدف SVM یافتن ابرصفحهای است که این حاشیه را به حداکثر میرساند و به افزایش استحکام مدل در دادههای جدید کمک میکند. در مواردی که دادهها بهصورت خطی در فضای ورودی تفکیکپذیر نباشند، SVM از فضایی با ابعاد بالاتر استفاده میکند؛ جایی که دادهها به صورت خطی قابلجداسازی شوند.
او اصطلاح کرنل یا هسته را اینگونه توضیح داد: در یادگیری ماشینی، کرنل به تابعی اطلاق میشود که فاصله بین نقاط داده را محاسبه میکند. از کرنلها معمولا در تکنیکهایی مانند ماشینهای بردار پشتیبان(SVM) و برخی الگوریتمهای «کاهش ابعاد» استفاده میشود. درSVMها، کرنلها نقش بسزایی در یافتن مرزهای تصمیمگیری بهینه دارند. تعیین کرنل خطی یا غیرخطی الگوریتمهای یادگیری را قادر میسازد تا در فضاهای با ابعاد بالا یا غیرخطی بدون محاسبه صریح مختصات نقاط، کار کنند و نتیجه بهدست آورند.
کرنلهای خطی برای جداکردن دادههایی استفاده میشود که بهصورت خطی تفکیکشدنی هستند؛ به این معنا که نقاط داده از گروهبندیهای مختلف را میتوان با یک خط مستقیم (در دو بعد)، یک ابرصفحه (در بیش از دو بعد) یا یک مرز تصمیمگیری خطی جدا کرد. این کرنلها برای مسائلی مناسبند که جداکننده دو گروه بین ویژگیها و گروهبندیها، رابطهای نزدیک به خطی دارند. ازکرنلهای غیرخطی زمانی استفاده میشود که دادهها بهصورت خطی در فضای ویژگی اصلی تفکیکپذیر نباشند. کرنلهای غیرخطی به الگوریتمهای یادگیری ماشینی اجازه میدهند تا دادهها را به فضایی با ابعاد بالاتر تبدیل کنند؛ جایی که بهصورت خطی قابل جداسازی میشوند و جداسازی موثر را ممکن میکنند.
شروع یادگیری ماشینی
هرچند که این اقتصاددان معتقد بود برای شروع به یادگیری ماشینی، مهارتهای زیادی لازم نیست، اما در طول سخنرانی روشن شد که برای تسلط بر آن، به ترکیبی از مهارتها و دانشها نیاز میرود: به ریاضیات (نظریه مجموعهها، جبر خطی، حساب دیفرانسیل و انتگرال و الگوریتمهای بهینهسازی) و آمار به آشنایی با فنون رگرسیون، درخت تصمیمگیری، شبکههای عصبی و خوشهبندی، برای پیادهسازی و آزمایش الگوریتمهای یادگیری به اکسل، پایتون و آر (R)؛ به توان درک انواع مختلف الگوریتمهای یادگیری ماشینی، به توان مدیریت و پردازش دادهها، به قدرت تشخیص ویژگیهای مرتبط از دادهها برای بهبود عملکرد مدلهای یادگیری ماشینی، به توان ارزیابی و اعتبارسنجی مدل، به داشتن تخصص در حوزهای که در آن از یادگیری ماشینی استفاده میشود.
طبیبیان استفاده از یادگیری ماشینی بدون برنامهنویسی را تا حدودی امکانپذیر میداند. به لطف توسعه ابزارها و سامانههای کاربرپسند، بدون کد یا کمکد، سادهسازی فرآیند ساخت مدلهای یادگیری ماشینی ممکن شده است که به کاربران اجازه میدهد بدون نوشتن کد، مدلهای ML خود را ایجاد کنند. سامانه colab.research.google یکی از این سامانههاست. در امر کدنویسی هم ابزاری که بسیار کارگشاست chatgpt است. البته وی تاکید میکند که گرچه این ابزارها میزان کدنویسی مورد نیاز را کاهش میدهند، اما نیاز به درک اصول یادگیری ماشینی هنوز برای انتخاب ویژگیهای مناسب، پردازش دادهها و تفسیر موثر نتایج بسیار مهم است.
طبیبیان نشان داد که سامانه رایگان Google Colab محیط مناسبی برای نوشتن و اجرای کد پایتون بهویژه برای یادگیری ماشینی است. راهاندازی آن نیازی به نصب نرمافزار ندارد، دسترسی آسان مبتنی بر اَبر و اتصال اینترنتی در آن فراهم است. این شیوه دسترسی رایگان به منابع محاسباتی دارد و بهراحتی روی گوگلدرایو ذخیره میشود. درواقع Colab ابزار آموزشی سادهای بهخصوص برای مبتدیانی است که مفاهیم یادگیری ماشینی را فرا میگیرند و همچنین برای پژوهشگرانی است که امکان محاسباتی محدودی در اختیار دارند.
طبیبیان اشارهای کوتاه هم به استفاده از روش ناپارامتریک «بوتاسترپینگ» در یادگیری ماشینی داشت. هنگامی که دادهها فراوان هستند و مشاهدات زیاد است، بهویژه برای تنظیم پارامترهای مدل و انتخاب و ارزیابی مدلها و بالاخص الگوریتمهای جنگلهای تصادفی، «بوتاسترپینگ» تکنیکی ساده برای تخمین توزیع و تکرار نمونهگیریهای لازم برای شبیهسازی مجموعههای آموزشی و آزمایشی متعدد تلقی میشود. این سخنران درک مفاهیم بوتاسترپینگ و نحوه کاربرد آن در یادگیری ماشینی را برای ساخت مدلهای قوی و دقیق بسیار ارزشمند میدانست.
چرا طبقهبندی مهم است؟
طبیبیان تصریح کرد که طبقهبندی جنبه مهم و برجستهای از یادگیری ماشینی است. این کار شامل تخصیص نقاط داده به گروهبندیها یا دستههای از پیشتعریفشده براساس ویژگیهای آنهاست. اما یادگیری ماشینی محدود به طبقهبندی نیست؛ ML از فنون رگرسیونهای خطی و پیچیدهتر، خوشهبندی (گروهبندی نقاط داده مشابه بر اساس ویژگیهای آنها، بدون دستهبندیهای از پیشتعریفشده)، تکنیک کاهش ابعاد (کاهش تعداد ویژگیها در عین حفظ اطلاعات مرتبط)، شناسایی نقاط داده نادر (برای شناسایی تقلب، محصولات معیوب و امنیت شبکه) پردازش زبان طبیعی، تحلیل سریهای زمانی و... استفاده میکند.
این اقتصاددان تاکید کرد که بیشمار کاربرد برای ML میتوان برشمرد و در اقتصاد هم ML در زمینههای مختلفی چون پیشبینیها از جمله پیشبینی شاخصهای اقتصادی همچون رشد تولید ناخالص داخلی، روندهای بازار سهام و نرخ تورم، تحلیلهای مالی، بهویژه تحلیل مجموعه دادههای مالی بزرگ برای شناسایی فرصتهای سرمایهگذاری بالقوه، امتیازدهی اعتباری، تحلیل رفتار و ترجیحات مصرفکننده، تقسیمبندی بازارها، مدیریت ریسک و یادگیری ماشینی کاربرد دارد. بهمنظور استفاده از یادگیری ماشینی برای امتیازدهی اعتباری در وامهای مصرفی برای بهبود دقت و بهینهسازی تصمیمات درخصوص اعطای وام، طبیبیان با ذکر مثال توضیح داد که نخست مجموعه دادههای تاریخی درخواست وام، از جمله ویژگیهایی مانند درآمد، سابقه اشتغال، سابقه اعتباری، مبلغ وام، مدت وام و موارد دیگر جمعآوری و پیشپردازش میشود. آنگاه به ترتیب ویژگیهای مرتبط تعریف میشود؛ مدل (الگوریتمهای یادگیری ماشینی مناسب برای طبقهبندی) انتخاب میشود با چند الگوریتم آزمایش میشود تا بهترین الگوریتم برای مجموعه داده یافت شود.
طبیبیان بر این خاصیت ML تاکید فراوان داشت که هر وقت یک مدل یادگیری ماشینی را در مورد موضوعی خاص آموزش بدهیم، اغلب میتوانیم از آن برای پیشبینی یا طبقهبندی موارد جدید و دیدهنشده بارها و بارها استفاده کنیم. وی تعمیم را یکی از مزایای کلیدی یادگیری ماشینی میدانست. یعنی، یک مدل یادگیری ماشینی آموزشدیده باید بهخوبی به دادههای جدیدی تعمیم داده شود که آموزشندیدهاند. باید بتوان الگوها را شناسایی کرد و پیشبینیهای دقیقی برای موارد مشابه با موارد آموزشدیده انجام داد. وی روشن کرد که محدودیتهای مدل، کیفیت دادهها، تفسیرپذیری، ملاحظات اخلاقی و مقرراتی، ضرورت بازآموزی و... چالشهای روبهروی رویکرد ML است.
تفاوت یادگیری ماشین با اقتصادسنجی
در این جلسه، طبیبیان مراقب بود که حاضران یادگیری ماشینی را با مفاهیم اقتصادسنجی درهم نیامیزند.وی تصریح کرد که یادگیری ماشینی جایگزین مستقیمی برای اقتصادسنجی نیز نیست. اقتصادسنجی شاخهای از علم اقتصاد است که از روشهای آماری برای تعیین کمیت و تبیین روابط اقتصادی و پیشبینی پدیدههای اقتصادی استفاده میکند. یادگیری ماشینی حوزه وسیعتری است که کامپیوترها را قادر میسازد الگوهایی را از دادهها یاد بگیرند و در حوزههای بسیار متنوع پیشبینی کنند یا تصمیم بگیرند. مدلهای اقتصادسنجی اغلب با هدف ارائه ضرایب تفسیرپذیر با معانی اقتصادی طراحی میشوند. مدلهای یادگیری ماشینی میتوانند پیچیده باشند و غالبا دقت پیشبینی را بر تفسیرپذیری اولویت میدهند. تکنیکهای یادگیری ماشینی انعطافپذیرتر از مدلهای اقتصادسنجیاند و همیشه به فرضیات دقیق نیاز ندارند.
بهنظر میرسد که طبیبیان این دو رشته را مکمل یکدیگر میداند و معتقد است که گرچه فنون یادگیری ماشینی تحلیل اقتصادی را با مدیریت مجموعههای داده بزرگ و پیچیده و روابط غیرخطی بهبود بخشیده است، اما اقتصادسنجی بهمثابه ابزاری حیاتی برای آزمایش نظریه اقتصادی، تحلیل سیاستها و ارائه تفسیرهای اقتصادی به عمر خود ادامه خواهد داد.
توضیح ارزش شپلی
غیر از ارائه مثالهای اقتصادی و طراحی الگوریتمهای ML برای آنها، طبیبیان علاقهمند بود که دو مقوله اقتصادی (ارزش شپلی و ضریب جینی) را توضیح داده و برای آنها مدلسازی ML کند. با توجه به کمبود وقت، ایشان فقط ارزش شپلی را توضیح دادند و فرصت مدلسازی نیافتند. طبیبیان اشاره کرد که قبل از «نظریه شپلی، » در اقتصاد فقط «ارزش بازار» را داشتیم. «ارزش شپلی» مفهومی از نظریه بازیهاست که برای محاسبه آن از رویکرد مبتنی بر ریاضی برای حل مسائل تخصیص در ترتیبات مشارکتی (بازیکنان برای دستیابی به اهداف مشترک با یکدیگر همکاری میکنند) استفاده میشود.
علت تعریف و استفاده از ارزش شپلی بهعنوان مثالی در زمینه یادگیری ماشینی توسط طبیبیان احتمالا به زمینه تفسیرپذیری مدل و اهمیت ویژگی برمیگردد. در یادگیری ماشینی، درک مشارکت ویژگیها یا متغیرهای مختلف در پیشبینیهای یک مدل برای تفسیرپذیری و اعتماد بسیار مهم است. مقدار ارزش شپلی را میتوان برای نسبتدادن «ارزش» یا تاثیر هر ویژگی در یک پیشبینی اعمال کرد. این به توضیح اینکه چرا هر مدل، پیشبینی خاصی انجام میدهد و چگونه ویژگیهای مختلف برای رسیدن به نتیجه با یکدیگر در تعاملند، کمک میکند. طبیبیان از این مثال برای آموزش یادگیری ماشینی استفاده کرد؛ چون مقدار شپلی با رویکرد «مقادیر» شپلی در یادگیری ماشین تطبیق داده شده است؛ جایی که از آن برای توضیح پیشبینی مدلهای پیچیده مانند شبکههای عصبی، جنگلهای تصادفی و... استفاده میشود. با محاسبه مقادیر شپلی برای ویژگیها، محققان و متخصصان میتوانند در مورد اینکه کدام ویژگیها بیشترین تاثیر را بر پیشبینیها دارند و اینکه چگونه تعاملات آنها بر نتایج تاثیر میگذارند، تصویر روشنی بهدست آورند.
لوید شپلی، ریاضیدان و اقتصاددان برنده جایزه نوبل آمریکایی، مفهوم ارزش شپلی را ارائه کرده که روشی برای توزیع عادلانه ارزش کل یا بازده تولیدشده در یک بازی مشارکتی است. «ارزش شپلی» فراتر از اقتصاد، در زمینههای علوم سیاسی، مذاکره و تخصیص منابع کاربرد دارد. ارزش شپلی راهی را برای تخصیص کل ارزش ایجادشده با همکاری بین بازیکنان به شیوهای منصفانه فراهم میکند. به بازیکنان برای مشارکتشان پاداش داده میشود؛ اما نقشهای متفاوتی را که بازی میکنند و ترتیب پیوستن آنها به ائتلافها را نیز در نظر میگیرد. بخش قابلملاحظهای از سخنرانی بیش از دو ساعته طبیبیان به ارائه مثال و عملا طراحی مدل ML و نشاندادن نتایج محاسباتی تخصیص یافت.
در این ارائه محمد طبیبیان بر تمام جزئیات ریاضی و آماری محاسبات، نگاشت مدل، کدنویسی پایتون و آر، استفاده از اکسل در طبقهبندی، استفاده از سامانههای سادهتر کاربرپسند و کارکرد ابزار Solver اکسل برای تعیین مقادیر بهینه متغیرهای تصمیمساز مسلط بود. برای جوانان حاضر در جلسه بسیار جالب بود که محمد طبیبیان، با چند کتاب و صدها مقاله در حوزههای تاریخ نظریههای اقتصادی، معرفتشناسی اقتصاد، فلسفه اقتصاد، روش علم، اقتصاد ایران، اقتصاد خرد، اقتصاد کلان، اقتصاد سیاسی و نیز با تجربه مشارکت در طراحی دو برنامه توسعه اقتصادی موفق در ایران، در ۷۵ سالگی خود را موظف میداند که در رشتههایی چون اقتصادسنجی، یادگیری ماشینی، تحقیق در عملیات، اقتصاد ریاضی، هوشمصنوعی، مدلسازی ریاضی، نظریه اطلاعات، علوم شناختی و... خود را بهروز نگاه دارد.