سکوی پردازش زبان فارسی عامیانه بهرهبرداری شد
به گزارش پژوهشگاه ارتباطات و فناوری اطلاعات، همگام با طراحی و توسعه سامانه ذکاوت (ذائقهسنجی کاربران و تحلیل ترافیک)، سکوی پردازش زبان فارسی عامیانه توسعه داده شده و در این سامانه مورد بهرهبرداری قرار گرفت. از آنجا که متنهای منتشرشده در پیامرسان/ شبکههای اجتماعی به صورت عامیانه بوده و پردازش زبان فارسی یکی از ارکان پایهای تحلیل محتوای متنی محسوب میشود، بنابراین براساس دانش موجود در پژوهشگاه ICT، سکوی پردازش زبان فارسی عامیانه (محاورهای) توسط پروژه «طراحی و ایجاد بستر تحلیل ترافیک و ذائقهسنجی کاربران فضای مجازی» توسعه داده شد و طی پروژه توسعه ذکاوت در فاز اول عملیاتی شده است. لیلا ربیعی، مجری این پروژه و مدیر گروه توسعه سرویس و مدیریت منابع هوش مصنوعی پژوهشگاه ICT گفت: این سکو شامل ابزارهای تشخیص موجودیتهای نامدار (NER)، نرمالساز فارسی(Normalizer)، برچسبزن ادات سخن(POSTagger) و چانکر (chunker) است که بهصورت API قابلیت ارائه خدمات را خواهد داشت. پیکرهای شامل ۵۰۰ هزار توکن فارسی از متون عامیانه شبکههای اجتماعی جهت توسعه ابزارهای برچسبزن ادات سخن و چانکر، توسط تیم زبانشناسی برچسبگذاری شده است. پژوهشگاه ارتباطات و فناوری اطلاعات در آزمایشگاههای مرکز توسعه و نوآوری هوش مصنوعی جهت ارائه خدمت به دانشجویان و محققان این حوزه اعلام آمادگی میکند.