هوش مصنوعی مولد؛ دیروز، امروز و آینده

عنوان این یادداشت به‌وضوح نشان می‌دهد که موضوع مورد بحث، هوش مصنوعی مولد (Generative AI) است. درک تعاریف مفاهیم در هر موضوع، نقطه آغاز هر بحثی محسوب می‌شود. در این زمینه، به ‌‌‌ویژه برای افرادی که تحولات این حوزه را پیگیری نمی‌‌‌کنند، واژه‌‌‌هایی مانند هوش مصنوعی، یادگیری ماشینی، یادگیری عمیق و مدل‌‌‌های زبانی بزرگ گاهی به‌‌‌ جای یکدیگر به ‌‌‌کار برده می‌‌‌شوند. مدل‌‌‌های زبانی بزرگ نوعی از هوش مصنوعی مولد و هوش مصنوعی مولد نیز شاخه‌‌‌ای از هوش مصنوعی است. تمامی آنها از اشکالی از یادگیری عمیق، شبکه‌‌‌های عصبی و همچنین یادگیری ماشینی نیز بهره می‌‌‌برند. امروز یکی از پایه‌‌‌های اصلی هوش مصنوعی مولد، مدل‌‌‌های ترنسفورمر (Transformers) هستند. «مدل‌‌‌های ترنسفورمر» به دلیل قابلیت مقیاس‌‌‌پذیری و پردازش موازی، در حوزه‌‌‌های مختلف، به‌‌‌ویژه پردازش متن مثل مدل‌‌‌های زبانی بزرگ، موفقیت‌‌‌های چشمگیری کسب کرده‌‌‌اند.

برای درک قدرت بالقوه این‌‌‌ مدل‌‌‌ها شاید ذکر این مثال جالب باشد که چند ماه پیش ایلان ماسک در مصاحبه‌‌‌ای و بعدتر هم در توییتر -هرچند به طور کنایه‌‌‌آمیز- گفت رئیس‌جمهور آمریکا در سال ۲۰۳۲ یکی از این مدل‌‌‌های هوش مصنوعی خواهد بود. چند نقد اساسی به مدل‌‌‌های هوش مصنوعی مولد و مدل‌‌‌های زبانی بزرگ وارد می‌شود. شاید مهم‌ترین نقد این باشد که ما مکانیزم داخلی این مدل‌‌‌ها را به‌‌‌خوبی نمی‌‌‌شناسیم که از این مشکل با عنوان «جعبه‌سیاه» یاد می‌شود. با وجود این، سال گذشته ابزارهای متنوعی برای فهم بهتر رفتار داخل این جعبه‌سیاه، توسعه‌یافته‌‌‌اند (این موضوع مفصل است اما ابزارهایی توسعه پیدا کرده‌‌‌اند که امکان ارزیابی دقیق‌‌‌تر مکانیزم‌‌‌های درونی مدل‌‌‌های زبانی بزرگ و نحوه رسیدن به یک خروجی را تا حدودی تفسیر می‌کنند).

اما سوال اصلی اینجاست که آیا مثلا ذهن یک پزشک، وکیل یا سرمایه‌گذار را که با استفاده از ابزارهای مختلف و ذهن و زبان (و شهود) خود تصمیم‌گیری می‌کنند، به‌‌‌طور کامل می‌‌‌شناسیم؟ هوش مصنوعی مولد هنوز در ابتدای راه پرپیچ و خم خود است، ولی می‌‌‌توان با استفاده از ابزارهای مختلف تلاش کرد این جعبه‌سیاه را بهتر درک کرد.  نقدهای دیگر، مانند سرعت تحولات بیرونی یا حجم عظیم داده‌‌‌های جدید که در مرحله آموزش مدل‌‌‌ها در دسترس نبودند، نیز چالش‌‌‌هایی قابل حل هستند. توسعه و آموزش مدل‌‌‌های بنیادی (Foundational Models) بسیار پرهزینه است. به‌عنوان مثال، ساخت مدل GPT۴ بیش از ۱۰۰میلیون دلار هزینه داشته است. از این جهت، دو روش مهم و کم‌‌‌هزینه برای استفاده از قدرت مدل‌‌‌های هوش مصنوعی مولد وجود دارد.

راه نخست، تنظیم مدل (fine tuning) است که وزن پارامترهای داخلی مدل را براساس کارکرد مورد نظر (Task) و داده‌‌‌های جدید تغییر می‌دهد و مدل را برای این کارکرد بهینه می‌کند. بسط این موضوع از محدوده این یادداشت خارج است، اما اکنون روش‌های ساده و در دسترسی برای تنظیم کم‌‌‌هزینه یک مدل وجود دارد. روش دوم که از اهمیت ویژه‌‌‌ای برخوردار است، قابلیت استخراج اطلاعات (retrieval) این مدل‌‌‌هاست. روش‌های مختلفی برای استفاده از این قابلیت وجود دارد که به طور کلی تحت عنوان «رگ» (Retrieval-Augmented Generation) شناخته می‌‌‌شوند.

این قابلیت بدون تغییر وزن‌‌‌ پارامترهای مدل، می‌‌‌تواند به‌سرعت اطلاعات مورد نظر را بازیابی کرده و در خروجی خود به کار گیرد. مدل‌‌‌های زبانی بزرگ نه‌تنها می‌‌‌توانند به انواع مختلف متن‌‌‌هایی که در دوره یادگیری خود نبودند دسترسی داشته باشند، بلکه مدل‌‌‌های جدیدتر، به‌اصطلاح چندمدله (omni-model یا multimodal) شده‌‌‌اند. این یعنی مدل می‌‌‌تواند براساس نیاز، بین صدا، تصویر، متن و عدد جابه‌‌‌جا شود و از تمامی آنها در یک فرآیند واحد استفاده کند. البته هوش مصنوعی مولد طرفداران و دشمنان افراطی خود را دارد. برخی آن را به سطح قابلیت پیش‌بینی کلمه بعدی در پیامک تقلیل می‌دهند و برخی آن را تا سطح یک هوش مصنوعی فرابشری بالا می‌‌‌برند. شناخت دقیق توانایی‌‌‌ها و محدودیت‌های آن می‌‌‌تواند به استفاده بهتر و موثرتر کمک کند. وقتی دولت سیزدهم ادعای تاسیس سازمان هوش مصنوعی را مطرح کرد، می‌‌‌شد حدس زد که مانند بسیاری دیگر از برنامه‌‌‌های دولتی، تنها به بریدن روبانی و ایجاد سازمانی جدید بسنده خواهد شد.

به‌‌‌‌عنوان یک اقتصاددان یا دنبال‌‌‌کننده علوم اجتماعی مثل اقتصاد، رصد دقیق توسعه و تحولات این بخش، هم به ‌‌‌خاطر اثر آن بر رشد اقتصادی و تحولات بازار کار و بازارهای مالی و هم به‌‌‌‌منظور استفاده در پژوهش‌‌‌های اقتصادی، ضروری به نظر می‌‌‌رسد. هوش مصنوعی مولد، هرچند در ابتدای راه خود قرار دارد، تاکنون در صنایع مختلف انقلاب ایجاد کرده است. این انقلاب از صنعت پزشکی تا صنعت مالی را در بر گرفته است، اما درک درست محدودیت‌ها و توانایی‌‌‌های آن نیز ضروری است و مقاومت در برابر آن می‌‌‌تواند ما را از پیشرفت بازدارد.

از امروز باید آموزش‌‌‌های مختلفی در سطوح گوناگون ارائه شود و در عین حال، باید از حداکثر ظرفیت این فناوری بهره‌‌‌برداری کرد تا خطاها و آسیب‌‌‌های آن زودتر شناسایی و اصلاح شوند. معرفی مدل جدید o۱ توسط OpenAI در هفته اخیر بخش دیگری از کوه یخ هوش مصنوعی را نشان داد که به دنبال آن  قابلیت‌هایی جدیدی مثل استدلال  (reasoning) و مشاهده و تفسیرپذیری (observability and interpretability) نتایج را وارد بازار کرد. این رده مدل‌های جدید پاسخی به  برخی از نقدهایی بود که به مدل‌های پیشین وارد می‌شد.

* پژوهشگر اقتصاد در دانشگاه ایندیانا