شیوههای مختلف یادگیری هوش مصنوعی
از یکسو نوعی از هوش مصنوعی را در اختیار داریم که همان هوش مصنوعی روانشناسانه است و بر این مبنا شکل گرفته که با تقلید ماشین از انسان و آموختن نحوه تصمیمگیری و حل مساله انسان، میتوان آن را آموزش داد تا مثل انسان عمل کند و به جای انسان کارها را انجام دهد.
هوش مصنوعی کلاسیک و جا افتاده تلاش دارد در ابتدا بررسی کند انسان چگونه یک کار را انجام میدهد و سپس همان شیوه را به کامپیوتر آموزش دهد و قواعدی را که به تحقق این هدف کمک میکند کشف کند. اما باید دانست که مغز انسان مثلا در زمان رانندگی به هزاران چیز توجه میکند که بسیاری از آنها قابل توصیف و آموزش به الگوریتمها نیستند. در نتیجه نمیتوان انتظار داشت که هوش مصنوعی کلاسیک بتواند دقیقا مانند یک انسان رانندگی کند و به تمام موارد و معیارها توجه داشته باشد.
از سویی دیگر ما با هوش مصنوعی «عمیق» سر و کار داریم که نسخه جدید و مدرن هوش مصنوعی است و تلاش نمیکند به ماشینها یاد بدهد مثل انسان رانندگی کنند و اصلا بر این اعتقاد نیست که انجام کارهایی مانند رانندگی با ماشین، حتما باید به همان شیوهای که انسانها آن را انجام میدهند صورت پذیرد.
در واقع این هوش مصنوعی جدید به دنبال یادگیری عمیق و کشف بهترین شیوه انجام هر کاری است و میکوشد از الگوریتمها برای پیدا کردن بهترین راهحل مسائل از طریق موتورهای جستوجو و سیستمهای پیشنهاد راهحل استفاده کند. به این نوع الگوریتمها «شبکههای عصبی مصنوعی عمیق» گفته میشود.
به عنوان مثال، سیستمهای کامپیوتری که ماشینهای خودران را کنترل میکنند از سه ماژول ساخته میشوند:
اول یک «ماژول ادراک» (Perception Module) که شامل یکسری دوربینها، رادارها و حسگرهاست و هر کدام وظایف خاصی را بر عهده دارند و با ترکیب شدن با همدیگر یکسری اطلاعات را در مورد محیط پیرامون ماشینهای خودران فراهم میآورند. دوم، «ماژول پیشبینی» (Prediction Module) است که پیشبینی میکند هر کدام از اشیای تشخیص داده شده در اطراف ماشین قرار است چه کاری انجام دهند و کدام مسیر را به چه شکلی طی کنند یا عابران پیاده قرار است چه کنند و چه واکنشی از خود نشان دهند.
ماژول سوم، «رویکرد رانندگی» (Driving policy Module) نام دارد که با توجه به پیشبینیهای صورت گرفته توسط ماژول پیشبینی، تصمیم میگیرد ادامه رانندگی چگونه باشد و به عنوان مثال، آیا باید بر سرعت ماشین افزود یا آن را کاهش داد و به چپ یا راست رفت.
الگوریتمهای شبکههای عصبی مصنوعی از سه بخش تشکیل میشوند: یک ورودی، یک تغییر و تبدیل و یک خروجی. شبکهای را در نظر بگیرید که در حال آموزش دیدن برای تشخیص یک اتوبوس مدرسه است. در ابتدا عکسهای متعددی که نقش ورودی را دارند به الگوریتم نشان داده میشوند که فقط بعضی از آنها اتوبوس مدرسه هستند. این عکسها از نوع عکسهای دیجیتال بوده و هر عکس از هزاران یا میلیونها پیکسل تجزیه شده به سهرنگ قرمز، سبز و آبی تشکیل شدهاند. از دید شبکه مصنوعی، یک عکس چیزی غیر از یک جدول بزرگ و عظیمالجثه از اعداد نیست که هر عدد نمایانگر یک پیکسل با یک رنگ مشخص است. این جدول «لایه ورودی» نامیده میشود و نقطه مقابل آن «لایه خروجی» نام دارد که از دو عدد صفر و یک تشکیل میشود. عدد ۱ نشان میدهد عکس مورد نظر عکس یک اتوبوس مدرسه هست و ۰ نشان میدهد که عکس مورد نظر عکس شیء دیگری غیر از اتوبوس مدرسه است. به طور کلی، تفاوت اصلی هوش مصنوعی کلاسیک با هوش مصنوعی جدید در نحوه تبدیل ورودی به خروجی است.
در شبکههای عصبی مصنوعی، تبدیل ورودی به خروجی از طریق یکسری لایههای پنهان صورت میپذیرد که باعث عمیقتر شدن شبکه میشوند و علت نامگذاری شبکههای عصبی عمیق هم همین ویژگی است. یک شبکه عصبی مصنوعی میتواند از چند لایه تا چند صد لایه پنهان تشکیل شده باشد که در آن هر لایه میتواند لایه قبلی را پالایش کند و این همان فرآیندی است که به آن یادگیری عمیق گفته میشود.
یادگیری شبکههای عصبی عمیق به سه شیوه است که عبارتاند از:
۱- شیوه تحت نظارت. یادگیری تحت نظارت را میتوان شناخته شدهترین و رایجترین نوع یادگیری در شبکههای عصبی عمیق دانست که در آن یک معلم و آموزشدهنده وجود دارد که بازخوردهایی از نوع بله یا خیر نشان میدهد. این نوع یادگیری برای تشخیص اشیایی مانند اتوبوس مدرسه یا علائم راهنمایی و رانندگی مورد استفاده قرار میگیرد.
در این نوع یادگیری برای فهم درست و کامل هر چیزی، شبکهای از هزاران و گاه میلیونها عکس و طبقهبندی صحیح آنها ارائه میشود و سپس یادگیری از طریق مطابقت دادن ورودی با خروجی اتفاق میافتد. در سیستمهای پیشنهاد مانند آنچه که در سایت آمازون اتفاق میافتد و آمازون کتابهایی را برای خرید به شما پیشنهاد میدهد، شما نقش معلمی را دارید که با کلیک کردن روی محتوایی خاص و لایک کردن یکسری کتابها در زمان جستوجو در سایت، به شبکه عصبی مصنوعی آمازون یاد میدهید کدام محتوا را به شما پیشنهاد دهد.
۲-شیوه بدون نظارت. یادگیری بدون نظارت بهگونهای است که بدون بازخورد اتفاق میافتد. بهعنوان مثال، شبکه عصبی مصنوعی به دنبال شباهتهای موجود در عکسها و تصاویر میگردد و خوشههایی از تصاویر مشابه را تولید میکند و در عمل بهگونهای کار میکند که گویی در آسمان شب به دنبال الگوسازی و به هم متصل کردن ستارههاست؛ بدون اینکه از علم ستارهشناسی آگاهی داشته باشد.
۳-از طریق تقویت. سومین نوع یادگیری از طریق تقویت اتفاق میافتد که طی آن شبکه عصبی اقدام به بازخوردگیری میکند؛ البته نه بعد از هر حرکت بلکه در پایان بازی.
در این حالت، تمام آنچه که شبکه میداند قواعد و قوانین بازی و هدف نهایی یعنی برنده شدن در آن است و شبکه تلاش میکند برای رسیدن به آن هدف و براساس قوانین تعریف شده برای بازی هر اقدامی صورت دهد و چنانچه در این مسیر شکست بخورد از شکستهایش درس میگیرد و اگر برنده شود راه بردن را میآموزد.
اگرچه درک و فهم منطق کلی شبکههای عصبی عمیق تا حد زیادی ساده به نظر میرسد، اما فهم اینکه یک شبکه دقیقا چه چیزی را «میبیند» بهمراتب دشوارتر است. همین جاست که تفاوت بین هوش مصنوعی روانشناسانه -که همه چیز در آن شفاف و مرئی است - با شبکههای عصبی مصنوعی و یادگیری عمیق - که لایههای پنهان بسیاری دارد - هویدا میشود. باید دانست که شبکههای عصبی مثل انسانها نمیاندیشند و چیزها را درک نمیکنند، بلکه میتوانند کارهایی را انجام دهند و مسائلی را حل کنند که فراتر از قدرت بشر هستند؛ هرچند که دارای نقاط کور و ضعفهای بزرگی نیز هستند که باعث میشود این شبکهها مرتکب اشتباهات فاحش و گاه خندهداری شوند که در قسمتهای بعد به آن اشاره خواهد شد.
منبع: کتاب The age of AI: and our human future