ترجمه ۲۰۰ زبان مختلف توسط هوش مصنوعی متا
به گزارش «دیلیمیل»، این کار به لطف فعالیت ابر رایانهای انجام میشود که که مارک زاکربرگ از آن به عنوان یکی از سریعترین ابررایانههای جهان یاد میکند. این شرکت تلاشهای خود در این زمینه را No Language Left Behind (هیچ زبانی از قلم نیفتاده) یا به اختصار NLLB مینامد و امیدوار است بتواند امکان انجام روزانه بیش از ۲۵میلیارد ترجمه در برنامههای متا را فراهم کند.
اگرچه امروز افراد در سراسر جهان به بیش از ۷۱۰۰ زبان مختلف صحبت میکنند، اما بسیاری از این زبانها دارای مجموعه دادههای کافی برای آموزش هوش مصنوعی نیستند. این زبانهای به اصطلاح کم منابع عبارتند از: عربی مصری، بالی (Balinese)، ساردینی (Sardinian)، فولانی (Nigerian Fulfulde)، پانگاسینانی (Pangasinan) و اومبوندو (Umbundu) که اگرچه توسط جمعیت قابل توجهی صحبت میشوند، اما در فضای اینترنت چندان مورد استفاده قرار نمیگیرند.
مارک زاکربرگ، مدیرعامل متا در بیانیهای که در فیسبوک منتشر شد، گفت: روشهای مدلسازی هوش مصنوعی که ما استفاده میکنیم، به ترجمه با کیفیت زبانهایی که میلیاردها نفر در سراسر جهان صحبت میکنند، کمک میکند. این مدل جدید میتواند ۵۵ زبان آفریقایی را با «با کیفیت بالا» ترجمه کند. این مدل ۲۰۰ زبانه دارای بیش از ۵۰ میلیارد پارامتر است و ما آن را با استفاده از یکی از سریعترین ابررایانههای هوش مصنوعی در جهان به نام SuperCluster آموزش دادیم.
زاکربرگ تصریح رد: هوش مصنوعی همه کارهای ما را بهبود میبخشد؛ از نمایش جالبترین محتواها در فیسبوک و اینستاگرام و ارائه تبلیغات مرتبط گرفته تا ایمن نگهداشتن خدماتمان برای همه؛ اما باید برقراری ارتباط میان انواع زبانها را یکی از ابرقابلیتهای هوش مصنوعی به حساب آورد. یکی از محققان هوش مصنوعی متا میگوید: توسعه چنین قابلیتی به آن معناست که میلیاردها نفر میتوانند به زبان مادری خود با دیگران ارتباط برقرار کنند.
این غول فناوری برای انجام پروژه «هیچ زبانی از قلم نیفتاده»، ابتدا نیاز به انجام مصاحبههای اکتشافی با افراد بومی که این زبانهای کم منابع را صحبت میکنند، داشت. آنها سپس یک مدل محاسباتی ایجاد کردند که با استفاده از دادههای به دست آمده و با روشهای جدید و موثر آموزش داده میشود. محققان همچنین به مزایای گستردهتر وارد کردن این نوع زبانها به عنوان راهی برای کاهش نابرابری دیجیتال اشاره میکنند. آنها معتقدند که هدف اصلی این پروژه کاهش نابرابریهای زبانی در یک بستر جهانی است.