تولید تصویر و کتاب مصور توسط چت جی‌پی‌تی

سیتنا: پژوهشگران اوپن‌ای‌آی با تلفیق قابلیت‌های دو ابزار هوش مصنوعی مولد مجزای این شرکت، ادعا می‌کنند که اکنون کاربران می‌توانند با هوش مصنوعی «ایده‌پردازی» کنند و با مدل جدید تبدیل متن به تصویر این شرکت که DALL-E ۳ است، می‌تواند درخواست‌های متنوع را به تصاویری با نهایت جزئیات و دقت ترجمه کند.

به گزارش ایندیپندنت، اوپن ای‌آی (OpenAI) هوش مصنوعی مولد تصویر این شرکت را با چت‌ جی‌پی‌تی، روبات چت بسیار پرطرفدارش، تلفیق کرده است. این شرکت تحت پشتیبانی مایکروسافت روز چهارشنبه از جدیدترین نسخه دال-‌ئی (DALL-E)، موسوم به دال-‌ئی ۳، رونمایی کرد که به کاربران امکان می‌دهد تصاویری تولید کنند که در مقایسه با سیستم‌های قبلی «ظرافت و جزئیاتش به میزان قابل‌ملاحظه‌ای بیشتر» است. پژوهشگران اوپن ای‌آی با تلفیق قابلیت‌های دو ابزار هوش مصنوعی مولد مجزای این شرکت، ادعا می‌کنند که اکنون کاربران می‌توانند با هوش مصنوعی «ایده‌پردازی» کنند.

سم آلتمن، رئیس اوپن ای‌آی، مثال می‌زند که چطور از این عملکرد دوگانه می‌شود استفاده کرد و می‌گوید: این ابزار می‌تواند با چند فرمان متنی ساده، یک قصه شب کودکانه را بنویسد و تصویرگری کند. سیستم‌های فعلی تبدیل متن به تصویر، مانند میدجرنی (Midjourney) یا دال-‌ئی ۲ اوپن ای‌آی، به‌دلیل ناتوانی در درک درخواست‌های خاص، فرمان‌های کاربران را اغلب اشتباه تفسیر می‌کنند. این موضوع به ظهور مهندسان پرسش که به خبرگان پرسش نیز معروف‌اند، منجر شده است؛ که [سیستم را] آموزش می‌دهند تا نتایج ابزارهای هوش مصنوعی مولد مانند چت جی‌پی‌تی و دال‌-‌ئی را بهینه‌سازی کنند. اوپن ای‌آی گفت: «مدل جدید [تبدیل] متن به تصویر ما، دال-‌ئی ۳، می‌تواند درخواست‌های متنوع را به تصاویری با نهایت جزئیات و دقت ترجمه کند.»

«دال‌-‌ئی ۳ به‌صورت بومی روی چت جی‌پی‌تی ساخته شده است‌ که به شما امکان می‌دهد از چت جی‌پی‌تی به عنوان شریک ایده‌پردازی و اصلاحگر فرمان‌ها استفاده کنید. فقط از چت جی‌پی‌تی آنچه مایلید ببینید را در هر قالبی، از یک جمله ساده گرفته تا پاراگرافی دقیق، بخواهید.»

جدیدترین نسخه دال‌-‌ئی فقط در دسترس کاربرانی خواهد بود که حق اشتراک می‌پردازند و در اکتبر، این به‌روزرسانی را با چت جی‌پی‌تی پلاس و چت جی‌پی‌تی اینترپرایز دریافت می‌کنند. اوپن ای‌آی همچنین قابلیت‌های امنیتی بهسازی‌شده را به مولد تصویر هوش مصنوعی‌اش افزوده است که به ادعای این شرکت، مانع خلق تصاویر مستهجن یا نفرت‌پراکن می‌شود. این تمهیدهای حفاظتی نادیده گرفتن واژه‌های خاص و رد درخواست ترسیم چهره‌های سرشناس را شامل می‌شود.