دکتر محمد طبیبیان مطرح کرد
یادگیری ماشینی؛ از تئوری تا عمل
حضور استاد با درسی جدید
سیدمحمد طبیبیان چهرهای شناختهشده در میان اقتصاددانان ایرانی است. این دانشآموخته دکترای دانشگاه دوک آمریکا، اقدامات مهم و تاثیرگذاری را درکارنامه خود دارد که از میان آنها میتوان به آموزش علم اقتصاد، حضور در سازمان برنامه و بودجه و ایجاد اکوسیستم مناسبی جهت رشد و تربیت دیدگاه عقلانی در کشور اشاره کرد. سالیان دراز کار علمی و پژوهشی مانع از آن نشده که ایشان آموختن و آموزش را کنار بگذارد. در همین راستا، روز چهارشنبه ۲۲ام شهریورماه، او با موضوعی بهروز در دانشکده مدیریت و اقتصاد شریف حاضر شد و در نشستی علمی با موضوع «یادگیری ماشینی و کاربرد آن در اقتصاد» به ارائه مطالب خود پرداخت. در این نشست علمی، هیات علمی دانشکده اقتصاد شریف و جمعی از دانشجویان علاقهمند حضور داشتند. برخی از اعضای هیات علمی دانشکده اقتصاد شریف سابقه شاگردی دکتر طبیبیان را در کارنامه خود داشتند که در نوع خود قابلتوجه است.
یادگیری ماشینی چه میگوید؟
طبیبیان عنوان ارائه خود را به کاربرد یادگیری ماشین در محاسبه خط فقر و تعیین وضعیت خانوارها اختصاص داد. به زعم او هرچند آموزش تئوریک ارزشمند و بااهمیت است اما هدف او از این ارائه، ترسیم کاربردهای عملیاتی یادگیری ماشینی در علم اقتصاد است. او با این توضیح سخنان خود را آغاز کرد که یادگیری ماشینی زیرمجموعه هوش مصنوعی است که با توسعه الگوریتمها و مدلها، کامپیوتر از دادهها یاد گرفته و پیشبینی میکند یا تصمیم میگیرد. به گفته این اقتصاددان، یادگیری ماشینی را باید راهی برای آموزش کامپیوترها دانست تا با استفاده از دادهها، خود ظرفیت تصمیمگیری یا استنتاج را بیابد. او بیان کرد که این شیوه مانند سیستمهای یادگیری گذشته به شکل برنامهنویسی کامپیوتری نیست، بلکه کامپیوتر الگوها و روابط دادهها را از طریق فرآیندهای ریاضی و محاسباتی خاصی فرامیگیرد. هوشمندی کامپیوتر از دو مأخذ حاصل میشود که یکدیگر را تقویت میکنند: یکی ساختاری است که الگوی ریاضی و محاسبات بهینه را بر دادهها اعمال میکند و دیگری محتوای اطلاعاتی دادههاست.
پیشنیاز فراگیری یادگیری ماشینی
در طول ارائه طبیبیان، روشن شد که فراگرفتن یادگیری ماشینی الزامات اولیه خود را میطلبد که در واقع ترکیبی از مهارتها و دانشهای مختلف است. از جمله این دانشها و مهارتها میتوان به ریاضیات (نظریه مجموعهها، جبر خطی، حساب دیفرانسیل و انتگرال و الگوریتمهای بهینهسازی) و آمار، آشنایی با فنون رگرسیون، درخت تصمیمگیری، شبکههای عصبی و خوشهبندی و برای پیادهسازی و آزمایش الگوریتمهای یادگیری به اکسل، پایتون و آر (R) اشاره کرد؛ از این گذشته، تسلط به یادگیری ماشینی به توان درک انواع مختلف الگوریتمهای یادگیری ماشینی، به توان مدیریت و پردازش دادهها، به قدرت تشخیص ویژگیهای مرتبط از دادهها برای بهبود عملکرد مدلهای یادگیری ماشینی، به توان ارزیابی و اعتبارسنجی مدل، به داشتن تخصص در حوزهای که در آن از یادگیری ماشینی استفاده میشود نیز بستگی دارد. بااینحال طبیبیان استفاده از یادگیری ماشینی بدون برنامهنویسی را تا حدودی امکانپذیر میداند. به گفته او، به لطف توسعه ابزارها و سامانههای کاربرپسند، بدون کد یا کمکد، سادهسازی فرآیند ساخت مدلهای یادگیری ماشینی ممکن شده است که به کاربران اجازه میدهد بدون نوشتن کد، مدلهای یادگیری ماشینی خود را ایجاد کنند.
یادگیری ماشین؛ مکمل اقتصادسنجی
این اقتصاددان در ادامه چند اصطلاح در یادگیری ماشینی را توضیح داد. او در ابتدا بیان کرد که feature در یادگیری ماشینی به همان معنای «متغیر» در اقتصادسنجی است؛ یعنی اصطلاحات «ویژگی» و «متغیر» اغلب به جای یکدیگر برای اشاره به متغیرهای ورودی مدل به کار میروند. اصطلاح دیگر مفهوم بردارهای حامی است. این بردارها از محاسبات ماشین حاصل میشوند و در محاسبه معادله صفحهای که دادهها را دو قسمت میکنند یا منحنی و رابطهای که دادهها را چند قسمت میکنند، به کار گرفته میشوند. در یادگیری ماشینی، تفسیر این بردارها، ساختار پاسخ را برای پژوهشگر مهیا میکند. هر ویژگی (یا متغیر) دارای مقادیر متناظر برای هر نمونه در مجموعه داده است. در یک مجموعه داده، هر ردیف معمولا یک نمونه یا مشاهده فردی را نشان میدهد (بهعنوان مثال، یک وام) و هر ستون نشاندهنده یک ویژگی (بهعنوان مثال سن، درآمد، یا جنسیت) است.
مقادیرِ درون ستونها، اندازهگیریها (ارزشها) را برای هر نمونه ارائه میکنند. در طول مرحله آموزش مدل، الگوریتم یاد میگیرد این مقادیر را با متغیر هدف (نتیجهای که میخواهیم پیشبینی کنیم) مرتبط کند و به مدل اجازه تعمیم و پیشبینی دادههای جدید را بدهد. طبیبیان تصریح کرد که یادگیری ماشینی جایگزین مستقیمی برای اقتصادسنجی نیست. به گفته او اقتصادسنجی شاخهای از علم اقتصاد است که از روشهای آماری برای تعیین کمیت و تبیین روابط اقتصادی و پیشبینی پدیدههای اقتصادی استفاده میکند. یادگیری ماشینی حوزه وسیعتری است که کامپیوترها را قادر میسازد الگوهایی را از دادهها یاد بگیرند و در حوزههای بسیار متنوع پیشبینی کنند یا تصمیم بگیرند.
مدلهای اقتصادسنجی اغلب با هدف ارائه ضرایب تفسیرپذیر با معانی اقتصادی طراحی میشوند، درحالیکه مدلهای یادگیری ماشینی میتوانند پیچیده باشند و غالبا دقت پیشبینی را بر تفسیرپذیری اولویت میدهند. تکنیکهای یادگیری ماشینی انعطافپذیرتر از مدلهای اقتصادسنجیاند و همیشه به فرضیات دقیق نیاز ندارند. این اقتصاددان این دو رشته را مکمل یکدیگر میداند و معتقد است گرچه فنون یادگیری ماشینی تحلیل اقتصادی را با مدیریت مجموعههای داده بزرگ و پیچیده و روابط غیرخطی بهبود بخشیده است، اما اقتصادسنجی بهمثابه ابزاری حیاتی برای آزمایش نظریات اقتصادی، تحلیل سیاستها و ارائه تفسیرهای اقتصادی به عمر خود ادامه خواهد داد.
کاربردهای عملیاتی
این اقتصاددان در ادامه ارائه خود، کاربرد یادگیری ماشین را با مثالهای کاربردی نشان داد. در مثال نخست، او نشان داد چگونه میتوان با تکنیکهای یادگیری ماشینی با تعداد محدودی از دادههای فشار و قند خون، به الگویی خودکار جهت غربال افراد در معرض خطر رسید. به گفته او این ابزار کمک میکند تا به صرف اندازهگیری فشار و قند خون، افراد در معرض خطر بدون نیاز به استفاده از پزشک برای معاینات بیشتر فراخوانده شوند. این اقتصاددان در نمونه دیگری از کاربردهای عملی یادگیری ماشین نشان داد که چگونه میتوان با این ابزار و دادههای مربوط به داراییها و درآمد خانوار، به الگویی جهت تعیین وضعیت خانوارها از نظر موقعیت نسبت به خط فقر دست یافت. به این ترتیب با این ابزار میتوان به سازوکاری دست یافت که با دقت بالایی خانوارهای فقیر و نیازمند مساعدتهای مالی دولت را از دیگران متمایز میسازد.