تولید تصویر و کتاب مصور توسط چت جیپیتی
به گزارش ایندیپندنت، اوپن ایآی (OpenAI) هوش مصنوعی مولد تصویر این شرکت را با چت جیپیتی، روبات چت بسیار پرطرفدارش، تلفیق کرده است. این شرکت تحت پشتیبانی مایکروسافت روز چهارشنبه از جدیدترین نسخه دال-ئی (DALL-E)، موسوم به دال-ئی ۳، رونمایی کرد که به کاربران امکان میدهد تصاویری تولید کنند که در مقایسه با سیستمهای قبلی «ظرافت و جزئیاتش به میزان قابلملاحظهای بیشتر» است. پژوهشگران اوپن ایآی با تلفیق قابلیتهای دو ابزار هوش مصنوعی مولد مجزای این شرکت، ادعا میکنند که اکنون کاربران میتوانند با هوش مصنوعی «ایدهپردازی» کنند.
سم آلتمن، رئیس اوپن ایآی، مثال میزند که چطور از این عملکرد دوگانه میشود استفاده کرد و میگوید: این ابزار میتواند با چند فرمان متنی ساده، یک قصه شب کودکانه را بنویسد و تصویرگری کند. سیستمهای فعلی تبدیل متن به تصویر، مانند میدجرنی (Midjourney) یا دال-ئی ۲ اوپن ایآی، بهدلیل ناتوانی در درک درخواستهای خاص، فرمانهای کاربران را اغلب اشتباه تفسیر میکنند. این موضوع به ظهور مهندسان پرسش که به خبرگان پرسش نیز معروفاند، منجر شده است؛ که [سیستم را] آموزش میدهند تا نتایج ابزارهای هوش مصنوعی مولد مانند چت جیپیتی و دال-ئی را بهینهسازی کنند. اوپن ایآی گفت: «مدل جدید [تبدیل] متن به تصویر ما، دال-ئی ۳، میتواند درخواستهای متنوع را به تصاویری با نهایت جزئیات و دقت ترجمه کند.»
«دال-ئی ۳ بهصورت بومی روی چت جیپیتی ساخته شده است که به شما امکان میدهد از چت جیپیتی به عنوان شریک ایدهپردازی و اصلاحگر فرمانها استفاده کنید. فقط از چت جیپیتی آنچه مایلید ببینید را در هر قالبی، از یک جمله ساده گرفته تا پاراگرافی دقیق، بخواهید.»
جدیدترین نسخه دال-ئی فقط در دسترس کاربرانی خواهد بود که حق اشتراک میپردازند و در اکتبر، این بهروزرسانی را با چت جیپیتی پلاس و چت جیپیتی اینترپرایز دریافت میکنند. اوپن ایآی همچنین قابلیتهای امنیتی بهسازیشده را به مولد تصویر هوش مصنوعیاش افزوده است که به ادعای این شرکت، مانع خلق تصاویر مستهجن یا نفرتپراکن میشود. این تمهیدهای حفاظتی نادیده گرفتن واژههای خاص و رد درخواست ترسیم چهرههای سرشناس را شامل میشود.