دعوت کتابخانه ملی از فناوران برای فهرستنویسی تحلیلی با هوش مصنوعی
رویداد نوآورانه «لیبتک ۲» از سوی مرکز نوآوری و توسعه کسبوکارهای داده محور سازمان اسناد و کتابخانه ملی ایران با موضوع چالش تشخیص موضوع(Topic Detection)، در حوزه فناوریهای کتابخانهای و استفاده از هوش مصنوعی به منظور پردازش داده و شناسایی موضوع آن، در دو مرحله برگزار میشود.
در مرحله اول از تمامی افراد، تیمها و شرکتها دعوت میشود در این رویداد ثبتنام کنند و پس از ثبتنام، دسترسی به دادههای لازم جهت شرکت در چالش در اختیار شرکتکنندگان قرار خواهد گرفت. این مرکز نوآوری به هر یک از شرکتکنندگان فضای پردازش رایگان ارائه میدهد و شرکتکنندگان باید تا تاریخ تعیین شده، مدل خود را ارتقا داده و در روز آزمون ارائه دهند. آزمون دقتسنجی مدل در تاریخ ۱۲ اسفند ماه برگزار خواهد شد.
در مرحله دوم پس از بررسی مدلهای آموزش داده شده، ۵ شرکتکننده برتر انتخاب میشوند و از این ۵ تیم بهمنظور ارائه حضوری مدل خود دعوت به عمل میآید و در نهایت، پس از داوری و بررسی نهایی تیمهای برتر معرفی خواهند شد. برای تیمهای برتر علاوه بر اعطای جایزه نقدی معادل ۵۰ میلیون تومان، امکان عقد قرارداد با سازمان اسناد و کتابخانه ملی ایران در نظر گرفته شده است.
دکتر مظفر پاسدارشیرازی، معاون توسعه مدیریت و منابع انسانی سازمان اسناد و کتابخانه ملی ایران، با اشاره به ضرورت برگزاری این رویداد فناورانه، توضیح داد: کتابخانه ملی برای هر کتاب فهرستی مشتمل بر «اطلاعات توصیفی» (شامل نام کتاب، نویسنده، ناشر) و «اطلاعات تحلیلی» (به موضوع متن کتاب و ردهبندی کتاب اشاره میکند) کتاب تهیه میکند و وقتی پژوهشگر اقدام به جستوجوی کتابی میکند سامانه متصل به موتور جستوجو در میان اطلاعات فهرست، کتابهای موردنظر آنها را جستوجو میکند و نتایج را ارائه میدهد.
وی با تاکید بر اینکه بر این اساس هر چه این فهرست کاملتر و دقیقتر و صحیحتر باشد، نتایج جستوجو بهتر خواهد بود، اظهار کرد: فهرست تحلیلی به پژوهشگر در دستیابی به منبع و بازیابی اطلاعات کمک میکند، ضمن آنکه اطلاعاتی در زمینه ردهبندی به کاربران ارائه میدهد و براساس آن تعیین خواهد کرد که کتاب به چه قفسه موضوعی اضافه شود تا مراجعان حضوری به کتابخانهها آن را بیابند.
پاسدارشیرازی با بیان اینکه کتابخانه ملی پیشتر نیز از فناوریها برای فهرستنویسی توصیفی کتابها بهره برده است، خاطر نشان کرد: سال گذشته از سامانهای رونمایی کردیم که بهصورت خودکار فهرست مقالات را استخراج میکرد و در راستای توسعه این سامانه، قابلیت جدیدی به آن اضافه شد که به کمک یادگیری عمیق، فراداده توصیفی پایاننامهها و کتابها را استخراج میکند که امیدواریم در یک ماه آینده رونمایی شود.
معاون سازمان اسناد و کتابخانه ملی، فهرستنویسی تحلیلی را از چالشهای این سازمان عنوان و اضافه کرد: نیاز ما این است که هرچه دقیقتر سامانه بتواند به کمک هوش مصنوعی برچسب و تگهای موضوعی را پیشنهاد دهد و همکار فهرستنویس از بین تگهای موضوعی که سامانه استخراج و پیشنهاد داده است، انتخاب کند و ردهبندی بر اساس استانداردهای کنگره صورت پذیرد. وی در این باره توضیح داد: ما از کسانی که در حوزه پردازش زبان طبیعی(NLP) فعالیت دارند، دعوت میکنیم تا در یک رقابت و همکاری سازنده، به حل چالش سازمان کمک کنند. مجموعه دادههای آموزشی که ما آماده کردهایم، در اختیار شرکتکنندگان در چالش قرار خواهد گرفت.