آینده هوش مصنوعی در دست معلمی با بزرگترین پایگاه داده رایگان جهان
این فرد کریستف شامن، معلم مدرسه است و برند LAION را از روی علاقه راهاندازی کرده است. در زمانهایی که شامن مشغول تدریس فیزیک و کامپیوتر به نوجوانان آلمانی نیست، با تیم کوچکی از داوطلبان، به ساخت بزرگترین مجموعه داده رایگان آموزش هوش مصنوعی مشغول میشود. این مجموعه داده برای تبدیل متن به عکس در سیستم Google Imagen و Stable Diffusion به کار میرود. پایگاههای دادهای مثل LAION برای سیستمهای هوش مصنوعی متن به عکس حیاتی هستند و حجم انبوهی از دادههای بصری را برای ساختارزدایی و ایجاد تصاویر جدید استفاده میکنند. آغاز ارائه این نوع محصولات تا سال گذشته یک تغییر پارادایم محسوب میشد و با موانع قانونی زیادی مواجه بود. اما شامن میگوید اینها نگرانی او نیستند و او صرفا میخواهد یک پایگاه داده رایگان ایجاد کند.
این معلم ۴۰ ساله، تقریبا از دو سال پیش به فکر راهاندازی LAION افتاد. اولین نسخهای که بات DALL-E شرکت OpenAI -مدل یادگیری عمیقی که تصاویر دیجیتال بر اساس کاراکترهای زبانی تولید میکند - منتشر کرد (ژانویه ۲۰۲۱)، تصویر یک مرغ صورتی بود که روی مبل نشسته بود. این تصویر شامن را به فکر انداخت که شرکتهای تکنولوژی بزرگ به دادههای اختصاصی بیشتری نیاز خواهند داشت. او میگوید: «فورا به این نتیجه رسیدم که اگر این موضوع فقط برای یک، دو یا سه شرکت متمرکزسازی شود، اثرات واقعا بدی برای جامعه خواهد داشت.»
بنابراین به همراه چند نفر دیگر، تصمیم گرفتند یک پایگاه داده متنباز راهاندازی کنند تا به آموزش مدلهای ترویج تصویر به متن کمک کنند. این آموزش یک فرآیند یکماهه است که میتوان آن را به یاد دادن یک زبان انگلیسی با میلیونها فلش کارت تشبیه کرد. این گروه از کدهای خام HTML استفاده کردند تا تصاویر را از وب جمعآوری کنند و آنها را با متنهای توصیفی همراه کنند. در این فرآیند، هیچگونه دخالت انسانی یا دستی صورت نمیگیرد. شامن و همراهانش، ظرف چند هفته توانستند ۳ میلیون تصویر و عکس را با هم جور کنند. بعد از سه ماه هم پایگاه دادهای با ۴۰۰ میلیون عکس و متن جورشده ایجاد کردند. این عدد حالا به بیش از ۶ میلیارد رسیده و LAION را به یکی از بزرگترین پایگاههای داده رایگان عکس و متن در دنیا تبدیل کرده است.