شرکتهای فناور به دنبال مدلهای کوچکتر هوش مصنوعی هستند
بزرگترین مدلهای زبانی بزرگ از میلیاردها یا تریلیونها پارامتر استفاده میکنند تا طیف گستردهای را از استدلال و وظایف مرتبط با پرسوجو انجام دهند. آنها با حجم بزرگی از دادهها آموزش دیدهاند که موضوعات گوناگونی را پوشش میدهند. از سوی دیگر، مدلهای زبانی کوچک فقط از میلیونها یا دهها میلیون پارامتر برای انجام دادن وظایف کمی استفاده میکنند و به قدرت محاسباتی کمتر و مجموعه کوچکتری از دادههای آموزشی متمرکز نیاز دارند. برای توسعهدهندگانی که برنامههای سادهتری دارند، مدلهای زبانی کوچک ممکن است تنها گزینه قابل اجرا باشند. اوپنایآی میگویدGPT-۴o mini تا ۶۰ درصد ارزانتر از GPT-۳.۵ Turbo است که پیش از این مقرونبهصرفهترین مدل این شرکت برای توسعهدهندگان بود.
یک مورد دیگر، بحث سرعت است. بسیاری از کاربردهای هوش مصنوعی به دانش عمومی گسترده یک مدل زبانی بزرگ نیاز ندارند. آنها ممکن است به پاسخهای سریعتری برای پرسشهای سادهتر نیاز داشته باشند. مایک اینتراتور، مدیرعامل «کورویو» که میزبان مدلهای هوش مصنوعی در فضای ابری است، گفت: «منظور از تاخیر، زمان مورد نیاز برای یک برنامه هوش مصنوعی برای دریافت پاسخ از یک مدل در فضای ابری است. اگر فرزند من مقاله ترم خود را با کمک هوش مصنوعی بنویسد، تاخیر مشکل بزرگی نیست، اما اگر بخواهد از آن برای جراحی یا رانندگی خودران استفاده کند، تاخیر با تاثیر بسیار بیشتری همراه میشود.» اینتراتور خاطرنشان کرد: «مدلهای مورد استفاده در خودروهای خودران باید به اندازهای کوچک باشند که روی یک تراشه رایانهای اجرا شوند، نه در یک سرور فضای ابری.» مدل GPT-۴o mini کوچکتر از مدلهای دیگر است، اما هنوز آن قدر کوچک نیست که روی دستگاهی مانند تلفن همراه یا کنسول بازی اجرا شود. بنابراین باید مانند سایر مدلهای شرکت اوپنایآی روی یک سرور در فضای ابری اجرا شود.
کلید نسل بعدی برنامههای هوش مصنوعی
رابرت نیشیهارا، یکی از بنیانگذاران و مدیرعامل شرکت «انیاسکیل» (Anyscale) گفت: «امروزه بیشتر برنامههای کاربردی مبتنی بر هوش مصنوعی شامل یک پرسوجو یا چند پرسوجو برای مدلی هستند که در فضای ابری اجرا میشود، اما برنامههای پیشرفته به پرسوجوهای زیادی برای مدلهای گوناگون نیاز دارند.
به عنوان مثال، برنامهای که به شما کمک میکند یک اقامتگاه اجارهای را انتخاب کنید، ممکن است از یک مدل برای ایجاد معیارهای انتخاب، یک مدل دیگر برای انتخاب گزینههای اجاره و یک مدل دیگر برای امتیاز دادن به هر یک از آن گزینهها استفاده کند. کارگردانی و سازماندهی همه این پرسشها یک تجارت پیچیده است.»
عملکرد مدلها مهم است، اما سرعت و هزینه آنها نیز به یک اندازه اهمیت دارد. اوپنایآی این موضوع را میداند؛ همانطور که شرکتهایی مانند متا و گوگل میدانند. نیشیهارا ادامه داد: «تلاشهای این شرکتها برای کوچکسازی مدلهای هوش مصنوعی برای برنامههای پیچیدهتر مانند دستیارهای شخصی بسیار مهم هستند.»
اوپنایآی اندازه پارامتر مدلهای خود را فاش نمیکند، اما مدل جدید آن احتمالا به اندازه Claude ۳ Haiku شرکت «آنتروپیک» (Anthropic) و Gemini ۱.۵ Flash گوگل است.
اوپنایآی گفت: GPT-۴o mini عملکرد بهتری نسبت به مدلهای مشابه در آزمایشها دارد. اوپنایآی خاطرنشان کرد که توسعهدهندگان اپلیکیشن میتوانند از طریق یک واسط برنامهنویسی کاربردی به GPT-۴o mini دسترسی داشته باشند و مدلهای جدید نیز از برنامه ChatGPT پشتیبانی میکنند.