دعوت کتابخانه ملی از فناوران برای فهرست‌نویسی تحلیلی با هوش مصنوعی

ایسنا : مرکز نوآوری و توسعه کسب‌وکارهای داده محور سازمان اسناد و کتابخانه ملی ایران، با برگزاری رویداد فناورانه، تیم‌های فناور را به رقابت در چالش مساله فهرست‌نویسی تحلیلی با کمک هوش مصنوعی دعوت کرد و قرار است برای بهترین ایده زمینه برای عقد قرارداد با این سازمان فراهم شود.

رویداد نوآورانه «لیبتک ۲» از سوی مرکز نوآوری و توسعه کسب‌وکارهای داده محور سازمان اسناد و کتابخانه ملی ایران با موضوع چالش تشخیص موضوع‌(Topic‌ Detection)، در حوزه فناوری‌های کتابخانه‌ای و استفاده از هوش مصنوعی به منظور پردازش داده و شناسایی موضوع آن، در دو مرحله برگزار می‌شود.

در مرحله اول از تمامی افراد، تیم‌ها و شرکت‌ها دعوت می‌شود در این رویداد ثبت‌نام کنند و پس از ثبت‌نام، دسترسی به داده‌های لازم جهت شرکت در چالش در اختیار شرکت‌کنندگان قرار خواهد گرفت. این مرکز نوآوری به هر یک از شرکت‌کنندگان فضای پردازش رایگان ارائه می‌دهد و شرکت‌کنندگان باید تا تاریخ تعیین شده، مدل خود را ارتقا داده و در روز آزمون ارائه دهند. آزمون دقت‌سنجی مدل در تاریخ ۱۲ اسفند ماه برگزار خواهد شد.

در مرحله دوم پس از بررسی مدل‌های آموزش داده شده، ۵ شرکت‌کننده برتر انتخاب می‌شوند و از این ۵ تیم به‌منظور ارائه حضوری مدل خود دعوت به عمل می‌آید و در نهایت، پس از داوری و بررسی نهایی تیم‌های برتر معرفی خواهند شد. برای تیم‌های برتر علاوه بر اعطای جایزه نقدی معادل ۵۰ میلیون تومان، امکان عقد قرارداد با سازمان اسناد و کتابخانه ملی ایران در نظر گرفته شده است.

دکتر مظفر پاسدارشیرازی، معاون توسعه مدیریت و منابع انسانی سازمان اسناد و کتابخانه ملی ایران، با اشاره به ضرورت برگزاری این رویداد فناورانه، توضیح داد: کتابخانه ملی برای هر کتاب فهرستی مشتمل بر «اطلاعات توصیفی» (شامل نام کتاب، نویسنده، ناشر) و «اطلاعات تحلیلی» (به موضوع متن کتاب و رده‌بندی کتاب اشاره می‌کند) کتاب تهیه می‌کند و وقتی پژوهشگر اقدام به جست‌وجوی کتابی می‌کند سامانه متصل به موتور جست‌وجو در میان اطلاعات فهرست، کتاب‌های موردنظر آنها را جست‌وجو می‌کند و نتایج را ارائه می‌دهد.

وی با تاکید بر اینکه بر این اساس هر چه این فهرست کامل‌تر و دقیق‌تر و صحیح‌تر باشد، نتایج جست‌وجو بهتر خواهد بود، اظهار کرد: فهرست تحلیلی به پژوهشگر در دستیابی به منبع و بازیابی اطلاعات کمک می‌کند، ضمن آنکه اطلاعاتی در زمینه رده‌بندی به کاربران ارائه می‌دهد و براساس آن تعیین خواهد کرد که کتاب به چه قفسه موضوعی‌ اضافه شود تا مراجعان حضوری به کتابخانه‌ها آن را بیابند.

پاسدارشیرازی با بیان اینکه کتابخانه ملی پیش‌تر نیز از فناوری‌ها برای فهرست‌نویسی توصیفی کتاب‌ها بهره برده است، خاطر نشان کرد: سال گذشته از سامانه‌ای رونمایی کردیم که به‌صورت خودکار فهرست مقالات را استخراج می‌کرد و در راستای توسعه این سامانه، قابلیت جدیدی به آن اضافه شد که به کمک یادگیری عمیق، فراداده‌ توصیفی پایان‌نامه‌ها و کتاب‌ها را استخراج می‌کند که امیدواریم در یک ماه آینده رونمایی شود.

معاون سازمان اسناد و کتابخانه ملی، فهرست‌نویسی تحلیلی را از چالش‌های این سازمان عنوان و اضافه کرد: نیاز ما این است که هرچه دقیق‌تر سامانه بتواند به کمک هوش مصنوعی برچسب و تگ‌های موضوعی را پیشنهاد دهد و همکار فهرست‌نویس از بین تگ‌های موضوعی‌ که سامانه استخراج و پیشنهاد داده است، انتخاب کند و رده‌بندی بر اساس استانداردهای کنگره صورت پذیرد. وی در این باره توضیح داد: ما از کسانی که در حوزه‌ پردازش زبان طبیعی‌(NLP) فعالیت دارند، دعوت می‌کنیم تا در یک رقابت و همکاری سازنده، به حل چالش سازمان کمک کنند. مجموعه داده‌های آموزشی که ما آماده کرده‌ایم، در اختیار شرکت‌کنندگان در چالش قرار خواهد گرفت.