فیس‌بوک نیاز به یک سیستم تشخیص کاراکتر نوری داشت که بتواند به‌طور منظم حجم زیادی از محتواها را پردازش کند. بنابراین باید فناوری مخصوص خود را توسعه می‌داد. با توجه به هویت این شبکه اجتماعی، «روزتا» متون بیش از یک میلیارد تصویر و فریم‌های ویدئویی را که به زبان‌های متنوع نوشته شده‌اند در زمان واقعی استخراج و ترجمه می‌کند. فیس‌بوک در یک پست جدید نحوه کار روزتا را این‌گونه توضیح داد: روزتا با تشخیص قاب‌های مستطیلی که قابلیت حاوی متن بودن را دارند، آغاز می‌کند. سپس با استفاده از یک شبکه عصبی به شناسایی و رونویسی آنچه در آن منطقه نوشته شده، حتی کلمات غیرانگلیسی یا حروف غیر لاتین مانند عربی و هندی می‌پردازد. فیس‌بوک برای آموزش این سیستم، از ترکیب تصاویر به اشتراک گذاشته شده توسط انسان‌ها و ماشین‌ها استفاده کرد. تیم‌های مختلف در فیس‌بوک و اینستاگرام در حال حاضر از روزتا استفاده می‌کنند تا محتوای بیشتری را بررسی و سیستم عامل خود را کنترل کنند. این شرکت قصد دارد تا تعداد زبان‌هایی را که روزتا می‌تواند درک کند، افزایش دهد و کاری کند تا در استخراج متن از فریم‌های ویدئویی بهتر عمل کند. فیس‌بوک به تازگی ۲۴ زبان جدید از جمله صربستانی، بلاروسی، مَراتی، سینهالی، تلوگو، نپالی، کانارا، اردو، پنجابی، کامبوجی، پشتو، مغولی، زولو، خوسایی و سومالیایی به سرویس ترجمه خودکار خود اضافه کرده است.