بایدو ابزار تبدیل عکس به متن ابداع کرد
رابین لی، مدیر ارشد اجرایی بایدو در کنفرانس سالانه جهانی شرکت، محصول I-RAG را معرفی کرد که یک فناوری تبدیل متن به عکس است و قابلیتهای جستوجوی بایدو برای برطرف کردن مشکل «توهم زدن» را ارتقا میدهد. این مشکل زمانی به وجود میآید که عکسهای تولیدی ربطی به متن وارد شده ندارند یا حاوی عناصر غیرواقعی هستند.
به گفته لی پلتفرم «ارنی» بایدو اکنون روزانه بیش از ۱.۵ میلیارد جستوجوی کاربر دارد و همچنین واکنشهای روزانه را کنترل میکند. این رقم نشاندهنده افزایش قابل توجهی نسبت به کنترل ۲۰۰ میلیون درخواست روزانهای است که در ماه مه گزارش شد. کنش و واکنشها شامل وظایفی مانند تولید متن، پاسخ دادن به سوالات و کمک در بهکارگیری اپلیکیشنهای مختلف با استفاده از هوش مصنوعی است.
تلاشهای تجاریسازی بایدو بهطور کلی حول محور هوش مصنوعی آن است که به کاربران اجازه میدهد اپلیکیشنهای خاص خود را تولید کنند. این شرکت همچنین فناوری را در سری محصولات فعلی خود یکپارچه کرده و آن را با استفاده از سرویسهای ابر به کاربران خارج از سیستم نیز ارائه میکند. همچنین بایدو یک عینک با قابلیت دستیار هوش مصنوعی توسعه داده که توسط بخش سختافزار آن (Xiaodu) ابداع شده است. این گجت مجهز به دوربینهایی است تا عکس و ویدئو را ثبت و از کنش و واکنشهای صوتی با «ارنی» پشتیبانی کند.