بایدو ابزار تبدیل عکس به متن ابداع کرد

رابین لی، مدیر ارشد اجرایی بایدو در کنفرانس سالانه جهانی شرکت، محصول I-RAG را معرفی کرد که یک فناوری تبدیل متن به عکس است و قابلیت‌های جست‌وجوی بایدو برای برطرف کردن مشکل «توهم زدن» را ارتقا می‌دهد. این مشکل زمانی به وجود می‌آید که عکس‌های تولیدی ربطی به متن وارد شده ندارند یا حاوی عناصر غیر‌واقعی هستند.

به گفته لی پلتفرم «ارنی» بایدو اکنون روزانه بیش از ۱.۵ میلیارد جست‌وجوی کاربر دارد و همچنین واکنش‌های روزانه را کنترل می‌کند. این رقم نشان‌دهنده افزایش قابل توجهی نسبت به کنترل ۲۰۰ میلیون درخواست روزانه‌ای است که در ماه مه ‌گزارش شد. کنش و واکنش‌ها شامل وظایفی مانند تولید متن، پاسخ دادن به سوالات و کمک در به‌کارگیری اپلیکیشن‌های مختلف با استفاده از هوش مصنوعی است.

تلاش‌های تجاری‌سازی بایدو به‌طور کلی حول محور هوش مصنوعی آن است که به کاربران اجازه می‌دهد اپلیکیشن‌های خاص خود را تولید کنند. این شرکت همچنین فناوری را در سری محصولات فعلی خود یکپارچه کرده و آن را با استفاده از سرویس‌های ابر به کاربران خارج از سیستم نیز ارائه می‌کند. همچنین بایدو یک عینک با قابلیت دستیار هوش مصنوعی توسعه داده که توسط بخش سخت‌افزار آن (Xiaodu) ابداع شده است. این گجت مجهز به دوربین‌هایی است تا عکس و ویدئو را ثبت و از کنش و واکنش‌های صوتی با «ارنی» پشتیبانی کند.