انواع الگوریتم‌های یادگیری ماشین

در یک دسته‌بندی کلی الگوریتم‌های یادگیری ماشین را می‌توان به سه دسته کلی، یادگیری نظارت‌شده، یادگیری غیرنظارت شده و یادگیری تقویتی تقسیم کرد. یادگیری نظارت‌شده: این نوع یادگیری زمانی رخ می‌دهد که شما مقادیر ورودی ماشین را به خوبی برچسب‌گذاری کرده باشید؛ یعنی پاسخ‌های درست متناظر با آنها را از قبل مشخص کرده باشید. به‌عنوان مثال شما یک مجموعه ورودی‌های عددی (مثلا اعداد طبیعی) و یک مجموعه جواب متناظر (مثلا ریشه سوم متناظر با تک‌تک آن اعداد طبیعی) را به ماشین می‌دهید سپس با آموزش دادن، ماشین یاد می‌گیرد که هر کدام از جواب‌ها ریشه سوم ورودی‌ها است. حال شما اگر یک ورودی کاملا جدید به ماشین بدهید، بر اساس تجربه یادگیری قبلی، او با احتمالی از صحت می‌تواند جواب متناظر را تشخیص دهد. این نکته روشن است که هر چقدر داده‌های آموزش شما به ماشین بیشتر باشد، با احتمال صحت بیشتری نمی‌تواند جواب‌های ورودی‌های جدید را مشخص کند. از اساسی‌ترین کارکردهای این نوع یادگیری در حوزه مالی می‌توان به پیش‌بینی قیمت، پیش‌بینی عرضه و تقاضا، پیش‌بینی بازار، نگهداری مشتری، تشخصیص کلاهبرداری بیمه‌ای و ... اشاره کرد.

یادگیری نظارت نشده: فرض کنید که شما به‌طور مرتب در معرض اطلاعاتی قرار می‌گیرید (مثلا واژه‌های یک زبان خارجی) که هیچ دانش قبلی از آنها ندارید و کسی هم نیست که به شما درخصوص آنها چیزی یاد دهد. شما در روزهای اول شاید هیچ چیز را متوجه نشوید ولی به مرور زمان مغزتان شروع به یادگیری می‌کند به‌طوری که اگر یک واژه را ببینید می‌توانید صوت متناسب با آن را حدس بزنید. این دقیقا چیزی است که در یادگیری بدون نظارت اتفاق می‌افتد. بنابراین می‌توان گفت این نوع یادگیری زمانی رخ می‌دهد که داده‌های ورودی شما برچسب‌گذاری نشده‌اند؛ یعنی شما جواب متناظر با آنها برای ماشین تعریف نکرده‌اید و ماشین فقط از طریق تحلیل ورودی‌ها و یافتن الگوهای در بین آنها می‌تواند آنها را تحلیل کند. به‌عنوان نمونه فرض کنید مجموعه‌ای از داده‌های ورودی را به مدل داده‌اید که شامل هزاران شکل هندسی است. در این حالت ماشین می‌تواند یاد بگیرد که از لحظ شکل چه اشکالی را می‌توان در یک خوشه مشخص قرار داد. حال شما یک شکل هندسی جدید به ماشین بدهید، ماشین می‌تواند با یک احتمال صحت مشخص بگوید این شکل به کدام خوشه متعلق است. از اساسی‌‌ترین کارکردهای این نوع یادگیری در حوزه مالی می‌توان به بخش‌بندی مشتری، تحلیل رفتار مصرف‌کننده، خوشه‌بندی شاخص‌های اساسی عملکرد مالی و ... اشاره کرد.

یادگیری تقویتی: شاید علم بیش از هر چیزی با یادگیری تقویتی توسعه پیدا کرده است. مثلا یک مهندس را در نظر بگیرید که می‌خواهد موتوری را طراحی کند که دور موتور آن در دقیقه (RPM) به مقداری از دامنه مشخصی مثلا ۱۰۰ تا ۱۵۰ برسد. آن مهندس با آزمودن روش‌های مختلف به مرور می‌فهمد که چه اقدامات (و طراحی‌هایی) را نباید انجام دهد و چه اقدامات (و طراحی هایی) را باید انجام دهد تا به خواست مورد نظرش برسد. این چیزی است که در روح یادگیری تقویتی نهفته است. در بسیاری از حیوانات، یادگیری تقویتی، تنها شیوه‌ یادگیری است. همچنین یادگیری تقویتی، بخشی اساسی از رفتار انسان‌ها را تشکیل می‌دهد. هنگامی که دست ما در مواجهه با حرارت می‌سوزد، به سرعت یاد می‌گیریم که این کار را بار دیگر تکرار نکنیم. لذت و درد مثال‌های خوبی از پاداش‌ها هستند که الگوهای رفتاری ما و بسیاری از حیوانات را تشکیل می‌دهند. در یادگیری تقویتی، هدف اصلی از یادگیری، انجام دادن کاری یا رسیدن به هدفی است، بدون آنکه عامل یادگیرنده، با اطلاعات مستقیم بیرونی تغذیه شود. در یادگیری تقویتی وقتی عامل کاری را انجام می‌دهد که او را به هدفش نزدیک‌تر می‌سازد، پاداش می‌گیرد و هدف او این است که اقداماتی را انجام دهد تا در درازمدت پاداش او را حداکثر سازند. اگرچه هم یادگیری نظارت شده و هم یادگیری تقویتی از نگاشت بین ورودی و خروجی استفاده می‌کنند، اما در یادگیری بر خلاف یادگیری نظارت شده از پاداش‌ها و تنبیه‌ها به‌عنوان سیگنال‌هایی برای بهبود عملکرد نهایی سیستم استفاده می‌شود.

ضمن اینکه تفاوت اصلی میان یادگیری تقویتی با روش‌های نظارتی یادگیری ماشین، در این است که در یادگیری تقویتی، هیچ گاه به عامل گفته نمی‌شود که کار درست در هر وضعیت کدام است (یعنی داده‌ها برچسب‌گذاری نمی‌شوند) و فقط به وسیله‌ معیاری، به عامل فهمانده می‌شود که یک عمل به چه میزان خوب یا به چه میزان بد است. این وظیفه‌ عامل یادگیرنده است که با در دست داشتن این اطلاعات، یاد بگیرد که بهترین عمل در هر وضعیت کدام است. این موضوع، بخشی از نقاط قوت خاص یادگیری تقویتی است. از این طریق، مسائل پیچیده‌ تصمیم‌گیری در اغلب اوقات می‌توانند با فراهم کردن کمترین میزان اطلاعات مورد نیاز برای حل مساله، حل شوند. شاید اساسی‌ترین کارکرد این نوع یادگیری در زمینه مالی، بازی‌سازی دادوستد مالی باشد.