آینده هوش مصنوعی در دست معلمی با بزرگ‌ترین پایگاه داده رایگان جهان

جلوی خانه‌‌‌ای در حومه شهر هامبورگ آلمان، کلمه LAION با مداد روی صندوق پست نوشته شده است. این تنها نشانه‌‌‌ای است که می‌‌‌گوید این خانه متعلق به فردی است که پایگاه داده گسترده‌‌‌ای دارد و در میان شکوفایی هوش مصنوعی در دنیا، همه توجه‌‌‌ها را به سمت خود جلب کرده است.

این فرد کریستف شامن، معلم مدرسه است و برند LAION را از روی علاقه راه‌‌‌اندازی کرده است. در زمان‌‌‌هایی که شامن مشغول تدریس فیزیک و کامپیوتر به نوجوانان آلمانی نیست، با تیم کوچکی از داوطلبان، به ساخت بزرگ‌ترین مجموعه داده رایگان آموزش هوش مصنوعی مشغول می‌شود. این مجموعه داده برای تبدیل متن به عکس در سیستم Google Imagen و Stable Diffusion به کار می‌رود. پایگاه‌‌‌های داده‌‌‌ای مثل LAION برای سیستم‌های هوش مصنوعی متن به عکس حیاتی هستند و حجم انبوهی از داده‌‌‌های بصری را برای ساختار‌زدایی و ایجاد تصاویر جدید استفاده می‌کنند. آغاز ارائه این نوع محصولات تا سال گذشته یک تغییر پارادایم محسوب می‌‌‌شد و با موانع قانونی زیادی مواجه بود. اما شامن می‌‌‌گوید اینها نگرانی او نیستند و او صرفا می‌‌‌خواهد یک پایگاه داده رایگان ایجاد کند.

این معلم ۴۰ ساله، تقریبا از دو سال پیش به فکر راه‌‌‌اندازی LAION افتاد. اولین نسخه‌‌‌ای که بات DALL-E شرکت OpenAI -مدل یادگیری عمیقی که تصاویر دیجیتال بر اساس کاراکترهای زبانی تولید می‌کند - منتشر کرد (ژانویه ۲۰۲۱)، تصویر یک مرغ صورتی بود که روی مبل نشسته بود. این تصویر شامن را به فکر انداخت که شرکت‌های تکنولوژی بزرگ به داده‌‌‌های اختصاصی بیشتری نیاز خواهند داشت. او می‌‌‌گوید: «فورا به این نتیجه رسیدم که اگر این موضوع فقط برای یک، دو یا سه شرکت متمرکزسازی شود، اثرات واقعا بدی برای جامعه خواهد داشت.»

بنابراین به همراه چند نفر دیگر، تصمیم گرفتند یک پایگاه‌‌‌ داده متن‌‌‌باز راه‌‌‌اندازی کنند تا به آموزش مدل‌‌‌های ترویج تصویر به متن کمک کنند. این آموزش یک فرآیند یک‌ماهه است که می‌توان آن را به یاد دادن یک زبان انگلیسی با میلیون‌‌‌ها فلش کارت تشبیه کرد. این گروه از کدهای خام HTML استفاده کردند تا تصاویر را از وب جمع‌‌‌آوری کنند و آنها را با متن‌‌‌های توصیفی همراه کنند. در این فرآیند، هیچ‌گونه دخالت انسانی یا دستی صورت نمی‌گیرد. شامن و همراهانش، ظرف چند هفته توانستند ۳ میلیون تصویر و عکس را با هم جور کنند. بعد از سه ماه هم پایگاه‌‌‌ داده‌‌‌ای با ۴۰۰ میلیون عکس و متن جور‌شده ایجاد کردند. این عدد حالا به بیش از ۶ میلیارد رسیده و LAION را به یکی از بزرگ‌ترین پایگاه‌‌‌های داده رایگان عکس و متن در دنیا تبدیل کرده است.