رقابت آمازون با انویدیا در جبهه هوش مصنوعی

بر اساس اعلام AWS، تراینیوم۳ که توسط واحد طراحی تراشه‌های اختصاصی این شرکت در آزمایشگاه‌های Annapurna توسعه‌یافته است می‌تواند هزینه آموزش و اجرای مدل‌های هوش مصنوعی را تا ۵۰درصد کاهش دهد. آن‌هم در مقایسه با سیستم‌هایی که از پردازنده‌های گرافیکی هم‌رده استفاده می‌کنند.

بر اساس آنچه وال‌استریت ژورنال نوشته است، این تراشه‌ها قرار است پشتوانه قدرتمندتری از توان پردازشی برای توسعه‌دهندگان نرم‌افزار فراهم کنند؛ یعنی برای افرادی مانند دین لایترسدورف، هم‌ بنیان‌گذار و مدیرعامل استارت‌آپ ویدئوی هوش مصنوعی Decart. او می‌گوید پس از آزمودن چندین تراشه رقیب از جمله پردازنده‌های انویدیا شرکتش با استفاده از تراینیوم۳ به یک پیشرفت مهم دست یافته است.

ده‌ها برنامه‌نویس و پژوهشگر هوش مصنوعی در شرکت مستقر در سان‌فرانسیسکوی او ماه‌ها تلاش کرده بودند نسخه‌ای از اپلیکیشن اصلی ویدئو‌سازی هوش مصنوعی دکارت، موسوم به Lucy را آموزش دهند؛ نسخه‌ای که بتواند ویدئو را به‌صورت بلادرنگ و بدون خطا یا مکث رندر کند.

AWS پس از ملاقات با تیم دکارت و تحت‌تاثیر قرار گرفتن از بنیان‌گذاران دسترسی زودهنگام به تراشه تراینیوم۳ را در اختیار این استارت‌آپ قرار داد. معرفی تراینیوم۳ تازه‌ترین ضربه رقابتی به انویدیا است؛ شرکتی که بازار پردازنده‌های گرافیکی را در اختیار دارد. موجی از قراردادهای اخیر نیز توجه سرمایه‌گذاران را جلب کرده است و نشان می‌دهد شمار بیشتری از شرکت‌های هوش مصنوعی به دنبال تنوع‌بخشی به تامین‌کنندگان خود هستند و خرید تراشه و سخت‌افزار را تنها به انویدیا محدود نمی‌کنند.

متا در حال مذاکره با گوگل است تا‌ میلیاردها دلار از تراشه‌های پیشرفته هوش مصنوعی موسوم به واحدهای پردازش تنسور (TPU) خریداری کند. هم‌زمان اوپن‌اِی‌آی نیز با رقبای انویدیا از جمله AMD و شرکت طراح تراشه‌های سفارشی Broadcom قرارداد بسته تا حجم عظیم توان پردازشی لازم برای آموزش و اجرای مدل‌های محبوب خود از جمله چت‌جی‌پی‌تی و سورا را تامین کند. با این حال روی آوردن شرکت‌ها به تامین‌کنندگان جدید به معنای کنار گذاشتن تراشه‌های انویدیا نیست و اعداد و ارقام عملکرد سه‌ماهه اخیر این شرکت شامل درآمد رکوردی، سود رو‌به‌افزایش و پیش‌بینی قوی برای آینده این موضوع را کاملا نشان می‌دهد. در واقع بسیاری از بزرگ‌ترین مشتریان تراشه‌های AWS همچنان از مشتریان انویدیا نیز هستند.

در این بین سرویس‌های وب آمازون (AWS) مجموعه‌ای از ابزارها و قابلیت‌های تازه حوزه هوش مصنوعی را معرفی کرده‌اند که قرار است به شرکت‌ها کمک کند ارزش بیشتری از هوش مصنوعی مولد استخراج کنند. به گفته AWS یکی از این قابلیت‌ها دسته جدیدی از ایجنت‌های هوش مصنوعی است که می‌توانند وظایف را ساعت‌ها یا حتی روزها بدون توقف و بدون نیاز به درخواست کمک از کاربر انجام دهند. مت گارمن، مدیرعامل AWS، گفت: «تمام تلاش ما در یک سال گذشته این بود که ببینیم چگونه می‌توان یک مغز واقعا مقاوم ساخت که قادر باشد زنجیره‌های کاری پیچیده را مدیریت کند.»

ایجنت‌ها ابزارهای هوش مصنوعی هستند که با انجام اقداماتی از طرف کاربر کار می‌کنند. اما این ابزارها معمولا در نقطه‌ای متوقف می‌شوند و مدام باید برای دریافت راهنمایی دوباره به سراغ کاربر برگردند. گارمن می‌گوید «ایجنت‌های فرانتیر» جدیدِ AWS که قادرند وظایفی با اهداف گسترده‌تر را در بازه‌های زمانی طولانی‌تری انجام دهند حاصل آن چیزی است که او «حجمی عظیم» از مهندسی نرم‌افزار، داده‌های زیرساختی، ترکیب چندین مدل مختلف و یک معماری حافظه قدرتمند توصیف می‌کند.

AWS همچنین از خدمتی به نام Nova Forge خبر داد؛ سرویسی که به شرکت‌ها اجازه می‌دهد نسخه‌های خصوصی مدل‌های Nova آمازون را با داده‌های اختصاصی خود آموزش دهند. این شرکت همچنین از عرضه عمومی تراشه هوش مصنوعی Trainium۳ پرده برداشت. آمازون این مجموعه اعلام‌ها را در کنفرانس سالانه خود در لاس‌وگاس ارائه کرد؛ مجموعه‌ای که در کنار هم نشان‌دهنده تعهد جدی AWS به حوزه هوش مصنوعی است.

AWS بارها به‌دلیل کندی در عرضه مدل‌های اختصاصی‌اش در رقابت هوش مصنوعی «عقب‌مانده» توصیف شده است. اما گارمن می‌گوید رواج جریان ایجنت‌ها دوباره این غول ابری را در مرکز صحنه قرار داده است، زیرا ایجنت‌ها برای انجام وظایف به دسترسی کامل به داده‌های سازمانی، اپلیکیشن‌های اصلی و زیرساخت‌های عملیاتی نیاز دارند. یعنی حوزه‌هایی که به‌طور گسترده بر معماری AWS تکیه دارند.

آمازون در گزارش درآمدی سه ‌ماهه سوم خود در اکتبر اعلام کرد درآمد AWS در این دوره ۲۰ درصد رشد داشته است؛ سریع‌ترین نرخ رشد از ۲۰۲۲ و همچنان موتور اصلی سود شرکت. در همین کنفرانس سرویس Nova Forge نیز معرفی شد. یعنی ابزاری برای سازمان‌هایی که می‌خواهند از مدل‌های مولد Nova استفاده کنند. این سرویس به مشتریان امکان می‌دهد داده‌های سازمانی خود را در مرحله پیش‌تمرین و میان‌تمرین مدل‌ها وارد کنند و در نتیجه مدلی اختصاصی بسازند که صرفا بر پایه داده‌های همان سازمان آموزش دیده و در صورت انتخاب به‌طور انحصاری در اختیارشان باشد.

به گفته گارمن شرکت‌هایی که نسخه بتای این مدل‌های سفارشی را آزموده‌اند ۴۰ تا ۶۰درصد بهبود عملکرد نسبت به روش‌هایی مانند فاین‌تیونینگ یا RAG تجربه کرده‌اند. او می‌گوید: «تصور ما این است که بسیاری از شرکت‌ها و استارت‌آپ‌ها از این سرویس به‌عنوان هسته اصلی استفاده می‌کنند؛ جایی که مدل باید واقعا کسب‌وکار و جریان‌های کاری‌شان را بفهمد.»