شکاف عمیق
یافتههای گزارش استنفورد درباره هوش مصنوعی چیست؟
یافتههای برجسته
مهمترین یافتههای گزارش استنفورد (۲۰۲۵) در ۱۰ مورد زیر برجسته است.
۱- صنعت، دانشگاه را پشت سر گذاشت: در سال ۲۰۲۴ میلادی، ۱۰۸ الگوی پایه از سوی بازیگران صنعتی تولید شد، درحالیکه سهم دانشگاهها تنها ۱۵ الگو بود. این شکاف برای نخستینبار در تاریخ، برتری قاطع صنعت را در پیشبرد تحقیقات پیشرفته نشان میدهد.
۲- هزینههای آموزش سر به فلک کشید: هزینههای آموزش الگوهای پیشرفته به سطوح غیرقابل تصوری رسیده است. طبق تخمینها، هزینه آموزش GPT-۴ حدود ۷۸ میلیون دلار و مدل Gemini Ultra گوگل حدود ۱۹۱ میلیون دلار بوده است. این هزینهها مانع بزرگی برای رقابت بازیگران کوچک است.
۳- آمریکا، چین را در تولید الگوهای برتر پشت سر گذاشت: ایالاتمتحده با تولید ۶۱ الگوی پایه قابلتوجه در سال ۲۰۲۴، رهبری را از چین (۱۵ الگو) و اتحادیه اروپا (۲۱ الگو) پس گرفت و به مرکز اصلی توسعه هوش مصنوعی پیشرفته تبدیل شده است.
۴- ارزیابی الگوها بهشدت ناکافی و غیراستاندارد است: توسعهدهندگان الگوهای پایه، عمدتاً از بنچمارکهای محدود برای تست الگوها استفاده میکنند. نبود تستهای استاندارد و جامع برای مسئولیتپذیری، خطرات ایمنی و سوگیری را افزایش میدهد.
۵- سرمایهگذاری در هوش مصنوعی مولد نجومی است: با وجود کاهش سرمایهگذاری خصوصی در حوزه AI، بخش هوش مصنوعی مولد شاهد رشد چشمگیری بود و سرمایهای بالغ بر ۲۵/ ۲ میلیارد دلار جذب کرد که تقریباً ۹ برابر سال ۲۰۲۲ است.
۶- هوش مصنوعی تاثیر ملموس و قابلاندازهگیری بر بازار کار دارد: مطالعات متعدد نشان میدهد هوش مصنوعی بهرهوری کارمندان را افزایش میدهد و به تولید کارهای باکیفیت کمک میکند. بااینحال، گزارش هشدار میدهد که این فناوری شکاف دستمزد میان کارگران ماهر و غیرماهر را نیز تشدید میکند.
۷- پیشرفت علمی با کمک هوش مصنوعی شتاب گرفت: از تولید الگوریتمهای مرتبسازی کارآمد تا کمک به کشف مواد جدید برای باتریها، هوش مصنوعی به ابزار حیاتی برای پیشبرد تحقیقات علمی تبدیل شده است.
۸- انفجار قوانین و مقررات AI در سراسر جهان: تعداد قوانین مرتبط با هوش مصنوعی در سطح جهان بهشدت افزایش یافت. در سال ۲۰۲۴، ۱۲۷ کشور نوعی از قوانین مرتبط با AI را تصویب یا تدوین کردهاند که این رقم در سال ۲۰۱۶ تنها یک کشور بود.
۹- مردم هم نگران و هم خوشبیناند: نظرسنجیهای جهانی نشاندهنده دوگانگی در افکار عمومی است. ۵۲ درصد مردم بر این باورند که هوش مصنوعی زندگی آنها را در پنج سال آینده بهشدت تغییر میدهد، اما همزمان، ۶۶ درصد نگران حریم خصوصی و استفادههای نادرست از آن هستند.
۱۰- تنوع در حوزه AI همچنان چالشی بزرگ است: در ایالاتمتحده، تنها ۹/ ۲ درصد از فارغالتحصیلان دکترای هوش مصنوعی سیاهپوست و ۲/ ۳ درصد اسپانیاییتبارند که نشاندهنده عدم توازن شدید در این حوزه است.
در یافتههای اساسی شکاف میان صنعت و دانشگاه به نقطه بحرانی رسیده است. گزارشها نشان میدهد تا قبل از سال ۲۰۱۴، اکثر الگوها از سوی دانشگاهها منتشر میشدند. اما در سال ۲۰۲۴، صنعت مسئول تولید بیش از هفت برابر الگوهای بیشتری نسبت به مجموع دانشگاه و نهادهای مشترک بوده است. این روند، دسترسی دانشگاهیان به منابع محاسباتی لازم برای تحقیقات پیشرفته را به چالش جدی تبدیل کرده است.
انتشار مقاله
تعداد کل مقالات مرتبط با هوش مصنوعی همچنان در حال افزایش است و در سال ۲۰۲۴ به بیش از ۵۰۰ هزار مقاله رسید که تقریباً دو برابر تعداد مقالات منتشرشده در سال ۲۰۱۵ است. گزارشها نشان میدهد که همکاریهای بینالمللی در تالیف مقالات AI به بالاترین سطح رسیده است. چین و ایالاتمتحده همچنان بزرگترین همکاران علمی یکدیگر هستند، بااینحال، نرخ رشد همکاری آنها در سه سال گذشته کند شده است که میتواند نشاندهنده تاثیر تنشهای ژئوپلیتیک باشد.
الگوهای چندوجهی
بخش قابلتوجهی از تحقیقات جدید روی الگوهایی متمرکز شده است که قادر به درک و پردازش همزمان انواع مختلف دادهها (متن، تصویر، صوت و ویدئو) است. الگوهای چندوجهی نهتنها در بنچمارکهای سنتی بهتر عمل میکنند، بلکه قابلیتهای جدیدی همانند پاسخ به سوالات پیچیده در مورد نمودارها یا ساخت ویدئو از روی متن را ممکن میکنند. این حوزه، کانون اصلی رقابت میان شرکتهای بزرگ مانند گوگل، OpenAI و متاست. بیش از ۶۰ درصد از الگوهای پایه جدید که در سال ۲۰۲۴ منتشر شدهاند، منبع-باز بودهاند (اگرچه سطح «باز بودن» آنها متفاوت است). این امر نوآوری را تسریع میکند اما نگرانیهای ایمنی را نیز به همراه دارد، زیرا کنترل کمتری روی نحوه استفاده از این الگوها وجود دارد.
معیارهای جدید
الگوهای هوش مصنوعی در بسیاری از بنچمارکهای کلاسیک به سطح عملکرد انسانی رسیده یا از آن فراتر رفتهاند. در بنچمارکهای معتبری همانند درک مطلب (SuperGLUE) و طبقهبندی تصاویر (ImageNet)، بهترین الگوها به عملکردی دست یافتهاند که بهبود بیشتر در آن دشوار و پرهزینه است. درحالیکه دقت الگوها در بنچمارک ImageNet از ۹۰ درصد در سال ۲۰۲۱ به ۹۲ درصد در سال ۲۰۲۴ رسیده، هزینه محاسباتی برای دستیابی به این دو درصد بهبود، چهار برابر شده است. این موضوع نشاندهنده بازده نزولی در معیارهای قدیمی است. این «اشباع» باعث شده که پژوهشگران به دنبال بنچمارکهای پیچیده و جامع باشند که توانایی استدلال، خلاقیت و ایمنی الگوها را بهتر بسنجند.
هزینههای سرسامآور
هزینه آموزش الگوهای پیشرفته به مانعی بزرگ برای رقابت تبدیل شده است. این گزارش تاکید میکند که توسعه هوش مصنوعی پیشرفته دیگر رقابت بر سر الگوریتمهای هوشمندانه نیست، بلکه به مسابقه بر سر منابع محاسباتی تبدیل شده است. این امر قدرت را در دست چند شرکت بزرگ که توانایی مالی و زیرساختی لازم را دارند، متمرکز میکند.
الگوهای بسته
بسیاری از الگوهای پیشرو همانند سری GPT و Gemini بهصورت «بسته» یا با دسترسی محدود از طریق API ارائه میشوند. گزارشها بهشدت از عدم شفافیت در مورد دادههای آموزشی، معماری الگو و روشهای ارزیابی الگوهای تجاری انتقاد میکند. بسته بودن ارزیابی مستقل خطرات، سوگیریها و آسیبپذیریهای را برای پژوهشگران خارجی تقریباً غیرممکن میکند. تحلیل روی ۴۰ الگوی پایه برجسته نشان داد که تنها ۳۲ درصد از آنها بهطور کامل اطلاعات مربوط به دادههای آموزشی را منتشر کردهاند. عدم شفافیت، اعتماد عمومی و مسئولیتپذیری را تضعیف میکند.
هوش مصنوعی مسئولانه
این بخش به یکی از حیاتیترین جنبههای هوش مصنوعی، یعنی ایمنی، انصاف و همراستایی با ارزشهای انسانی میپردازد. یافتههای امسال نگرانکننده هستند.
سوگیری و انصاف
با وجود تلاشهای گسترده، الگوهای زبانی بزرگ همچنان سوگیریهای موجود در دادههای اینترنتی را بازتولید و حتی تقویت میکنند. بر اساس مطالعه جدید که در گزارش به آن استناد شده، محبوبترین الگوهای زبانی در پاسخ به سوالات مربوط به گروههای مختلف جمعیتی، تا ۳۰ درصد سوگیری بیشتر نسبت به دادههای اولیه اینترنتی از خود نشان میدهند. یافتهها نشان میدهد فرآیند آموزش (Fine-tuning) میتواند به جای کاهش، سوگیریها را تشدید کند. برای مثال الگوها همچنان مشاغل خاصی را به جنسیتهای خاصی نسبت میدهند و کلیشههای فرهنگی را تکرار میکنند.
محتوای مضر
ابزارهای ایمنی که برای جلوگیری از تولید محتوای سمی، نفرتپراکن یا خطرناک در الگوها تعبیه میشوند، بهراحتی قابل دور زدن هستند. گزارشها میزان موفقیت جیلبریک (Jailbreaking) یا فریب دادن الگوها را برای تولید محتوای ممنوعه نشان میدهد. در برخی از الگوهای مطرح، تا ۷۰ درصد از تلاشها برای دور زدن فیلترهای ایمنی موفقیتآمیز بوده است.
روندهای سرمایهگذاری
درحالیکه کل سرمایهگذاری خصوصی در AI در سال ۲۰۲۴ با کاهش جزئی روبهرو شد، حوزه هوش مصنوعی مولد استثنای بزرگ بود. سرمایهگذاری در هوش مصنوعی مولد با جذب ۲/ ۲۵ میلیارد دلار، نسبت به سال قبل ۹ برابر شده است. این مبلغ بیش از کل سرمایهگذاری خصوصی در همه حوزههای AI در سال ۲۰۱۹ و نشاندهنده تغییر پارادایم در تمرکز بازار است. ایالاتمتحده با جذب ۲/ ۶۷ میلیارد دلار سرمایه خصوصی در سال ۲۰۲۴، همچنان پیشتاز مطلق بوده و تقریباً هشت برابر چین (رتبه دوم) سرمایه جذب کرده است.
تاثیر بر بهرهوری
شواهد ملموسی از تاثیر AI بر بهرهوری و وظایف شغلی در حال ظهور است. مطالعات متعدد نشان میدهد ابزارهای AI (مانند دستیارهای کدنویسی یا تولید متن) میتوانند بهطور قابلتوجهی سرعت و کیفیت کار کارمندان را افزایش دهند. مطالعهای در اینباره نشان داد، استفاده از دستیار AI، بهرهوری برنامهنویسان را تا ۵۶ درصد افزایش داده است. هوش مصنوعی میتواند نابرابری درآمدی را تشدید کند. این فناوری عمدتاً مکمل مهارتهای کارگران با تحصیلات عالی است و همزمان وظایف کارگران با مهارت کمتر را خودکار میکند. تقاضا برای استخدام متخصصان هوش مصنوعی در تمام بخشهای اقتصادی ایالاتمتحده از سال ۲۰۱۸ دو برابر شده است که نشاندهنده نیاز شدید بازار به این مهارتهاست.
سیاستگذاری و آموزش
دولتها در سراسر جهان با سرعت در حال تدوین قوانینی برای مدیریت هوش مصنوعی هستند. تعداد لوایح و قوانین مرتبط با AI که در مجالس قانونگذاری آمریکا تصویب شده، از یک مورد در سال ۲۰۱۵ به ۲۵ مورد در سال ۲۰۲۴ افزایش یافته است. در سطح جهانی، ۱۲۷ کشور در حال تدوین مقررات برای AI هستند. قانون AI اتحادیه اروپا (EU AI Act) بهعنوان جامعترین و تاثیرگذارترین تلاش برای رگولاتوری AI در جهان شناخته میشود و به استاندارد جهانی تبدیل شده است که سایر کشورها از آن الگوبرداری میکنند. البته نگرش مردم نسبت به هوش مصنوعی پیچیدهتر شده است.
نگاه به آینده
گزارش شاخص هوش مصنوعی ۲۰۲۵ تصویری از فناوری قدرتمند و بهسرعت در حال پیشرفت را ترسیم میکند که در نقطه عطف تاریخی قرار دارد. از یکسو، پیشرفتهای فنی و سرمایهگذاریهای عظیم، پتانسیل AI را برای حل مشکلات بزرگ بشری، بیش از هر زمان دیگری آشکار کرده است. از سوی دیگر، تمرکز قدرت در دست چند شرکت، هزینههای سرسامآور، چالشهای عمیق در زمینه ایمنی و سوگیری، و نبود حاکمیت و نظارت کافی، زنگهای خطر را به صدا درآورده است. گزارش ۲۰۲۵ با این پیام به پایان میرسد که دهه آینده، دهه گذار از «اثبات توانایی» به «اثبات مسئولیتپذیری» برای حوزه هوش مصنوعی است. موفقیت در این گذار، آینده این فناوری و تاثیر آن بر بشر را شکل میدهد.