هوش مصنوعی مولد؛ دیروز، امروز و آینده
عنوان این یادداشت بهوضوح نشان میدهد که موضوع مورد بحث، هوش مصنوعی مولد (Generative AI) است. درک تعاریف مفاهیم در هر موضوع، نقطه آغاز هر بحثی محسوب میشود. در این زمینه، به ویژه برای افرادی که تحولات این حوزه را پیگیری نمیکنند، واژههایی مانند هوش مصنوعی، یادگیری ماشینی، یادگیری عمیق و مدلهای زبانی بزرگ گاهی به جای یکدیگر به کار برده میشوند. مدلهای زبانی بزرگ نوعی از هوش مصنوعی مولد و هوش مصنوعی مولد نیز شاخهای از هوش مصنوعی است. تمامی آنها از اشکالی از یادگیری عمیق، شبکههای عصبی و همچنین یادگیری ماشینی نیز بهره میبرند. امروز یکی از پایههای اصلی هوش مصنوعی مولد، مدلهای ترنسفورمر (Transformers) هستند. «مدلهای ترنسفورمر» به دلیل قابلیت مقیاسپذیری و پردازش موازی، در حوزههای مختلف، بهویژه پردازش متن مثل مدلهای زبانی بزرگ، موفقیتهای چشمگیری کسب کردهاند.
برای درک قدرت بالقوه این مدلها شاید ذکر این مثال جالب باشد که چند ماه پیش ایلان ماسک در مصاحبهای و بعدتر هم در توییتر -هرچند به طور کنایهآمیز- گفت رئیسجمهور آمریکا در سال ۲۰۳۲ یکی از این مدلهای هوش مصنوعی خواهد بود. چند نقد اساسی به مدلهای هوش مصنوعی مولد و مدلهای زبانی بزرگ وارد میشود. شاید مهمترین نقد این باشد که ما مکانیزم داخلی این مدلها را بهخوبی نمیشناسیم که از این مشکل با عنوان «جعبهسیاه» یاد میشود. با وجود این، سال گذشته ابزارهای متنوعی برای فهم بهتر رفتار داخل این جعبهسیاه، توسعهیافتهاند (این موضوع مفصل است اما ابزارهایی توسعه پیدا کردهاند که امکان ارزیابی دقیقتر مکانیزمهای درونی مدلهای زبانی بزرگ و نحوه رسیدن به یک خروجی را تا حدودی تفسیر میکنند).
اما سوال اصلی اینجاست که آیا مثلا ذهن یک پزشک، وکیل یا سرمایهگذار را که با استفاده از ابزارهای مختلف و ذهن و زبان (و شهود) خود تصمیمگیری میکنند، بهطور کامل میشناسیم؟ هوش مصنوعی مولد هنوز در ابتدای راه پرپیچ و خم خود است، ولی میتوان با استفاده از ابزارهای مختلف تلاش کرد این جعبهسیاه را بهتر درک کرد. نقدهای دیگر، مانند سرعت تحولات بیرونی یا حجم عظیم دادههای جدید که در مرحله آموزش مدلها در دسترس نبودند، نیز چالشهایی قابل حل هستند. توسعه و آموزش مدلهای بنیادی (Foundational Models) بسیار پرهزینه است. بهعنوان مثال، ساخت مدل GPT۴ بیش از ۱۰۰میلیون دلار هزینه داشته است. از این جهت، دو روش مهم و کمهزینه برای استفاده از قدرت مدلهای هوش مصنوعی مولد وجود دارد.
راه نخست، تنظیم مدل (fine tuning) است که وزن پارامترهای داخلی مدل را براساس کارکرد مورد نظر (Task) و دادههای جدید تغییر میدهد و مدل را برای این کارکرد بهینه میکند. بسط این موضوع از محدوده این یادداشت خارج است، اما اکنون روشهای ساده و در دسترسی برای تنظیم کمهزینه یک مدل وجود دارد. روش دوم که از اهمیت ویژهای برخوردار است، قابلیت استخراج اطلاعات (retrieval) این مدلهاست. روشهای مختلفی برای استفاده از این قابلیت وجود دارد که به طور کلی تحت عنوان «رگ» (Retrieval-Augmented Generation) شناخته میشوند.
این قابلیت بدون تغییر وزن پارامترهای مدل، میتواند بهسرعت اطلاعات مورد نظر را بازیابی کرده و در خروجی خود به کار گیرد. مدلهای زبانی بزرگ نهتنها میتوانند به انواع مختلف متنهایی که در دوره یادگیری خود نبودند دسترسی داشته باشند، بلکه مدلهای جدیدتر، بهاصطلاح چندمدله (omni-model یا multimodal) شدهاند. این یعنی مدل میتواند براساس نیاز، بین صدا، تصویر، متن و عدد جابهجا شود و از تمامی آنها در یک فرآیند واحد استفاده کند. البته هوش مصنوعی مولد طرفداران و دشمنان افراطی خود را دارد. برخی آن را به سطح قابلیت پیشبینی کلمه بعدی در پیامک تقلیل میدهند و برخی آن را تا سطح یک هوش مصنوعی فرابشری بالا میبرند. شناخت دقیق تواناییها و محدودیتهای آن میتواند به استفاده بهتر و موثرتر کمک کند. وقتی دولت سیزدهم ادعای تاسیس سازمان هوش مصنوعی را مطرح کرد، میشد حدس زد که مانند بسیاری دیگر از برنامههای دولتی، تنها به بریدن روبانی و ایجاد سازمانی جدید بسنده خواهد شد.
بهعنوان یک اقتصاددان یا دنبالکننده علوم اجتماعی مثل اقتصاد، رصد دقیق توسعه و تحولات این بخش، هم به خاطر اثر آن بر رشد اقتصادی و تحولات بازار کار و بازارهای مالی و هم بهمنظور استفاده در پژوهشهای اقتصادی، ضروری به نظر میرسد. هوش مصنوعی مولد، هرچند در ابتدای راه خود قرار دارد، تاکنون در صنایع مختلف انقلاب ایجاد کرده است. این انقلاب از صنعت پزشکی تا صنعت مالی را در بر گرفته است، اما درک درست محدودیتها و تواناییهای آن نیز ضروری است و مقاومت در برابر آن میتواند ما را از پیشرفت بازدارد.
از امروز باید آموزشهای مختلفی در سطوح گوناگون ارائه شود و در عین حال، باید از حداکثر ظرفیت این فناوری بهرهبرداری کرد تا خطاها و آسیبهای آن زودتر شناسایی و اصلاح شوند. معرفی مدل جدید o۱ توسط OpenAI در هفته اخیر بخش دیگری از کوه یخ هوش مصنوعی را نشان داد که به دنبال آن قابلیتهایی جدیدی مثل استدلال (reasoning) و مشاهده و تفسیرپذیری (observability and interpretability) نتایج را وارد بازار کرد. این رده مدلهای جدید پاسخی به برخی از نقدهایی بود که به مدلهای پیشین وارد میشد.
* پژوهشگر اقتصاد در دانشگاه ایندیانا