سکوی پردازش زبان فارسی عامیانه بهره‌برداری شد

مهر: سکوی پردازش زبان فارسی عامیانه(محاوره‌ای)، به عنوان یکی از دستاوردهای مهم پژوهشی، توسعه‌ای و کاربردی سامانه ذکاوت (ذائقه‌سنجی کاربران و تحلیل ترافیک) مورد بهره‌برداری قرار گرفت.

به گزارش پژوهشگاه ارتباطات و فناوری اطلاعات، همگام با طراحی و توسعه سامانه ذکاوت (ذائقه‌سنجی کاربران و تحلیل ترافیک)، سکوی پردازش زبان فارسی عامیانه توسعه داده شده و در این سامانه مورد بهره‌برداری قرار گرفت. از آنجا که متن‌های منتشرشده در پیام‌رسان/ شبکه‌های اجتماعی به صورت عامیانه بوده و پردازش زبان فارسی یکی از ارکان پایه‌ای تحلیل محتوای متنی محسوب می‌شود، بنابراین براساس دانش موجود در پژوهشگاه ICT، سکوی پردازش زبان فارسی عامیانه (محاوره‌ای) توسط پروژه «طراحی و ایجاد بستر تحلیل ترافیک و ذائقه‌سنجی کاربران فضای مجازی» توسعه داده شد و طی پروژه توسعه ذکاوت در فاز اول عملیاتی شده است. لیلا ربیعی، مجری این پروژه و مدیر گروه توسعه سرویس و مدیریت منابع هوش مصنوعی پژوهشگاه ICT گفت: این سکو شامل ابزارهای تشخیص موجودیت‌های نامدار (NER)، نرمال‌ساز فارسی(Normalizer)، برچسب‌زن ادات سخن(POSTagger) و چانکر (chunker) است که به‌صورت API قابلیت ارائه خدمات را خواهد داشت. پیکره‌ای شامل ۵۰۰ هزار توکن فارسی از متون عامیانه شبکه‌های اجتماعی جهت توسعه ابزارهای برچسب‌زن ادات سخن و چانکر، توسط تیم زبان‌شناسی برچسب‌گذاری شده است. پژوهشگاه ارتباطات و فناوری اطلاعات در آزمایشگاه‌های مرکز توسعه و نوآوری هوش مصنوعی جهت ارائه خدمت به دانشجویان و محققان این حوزه اعلام آمادگی می‌کند.