هوش مصنوعی نمی‌تواند مترجم خیلی خوبی باشد!

قسمت پنجاه و یکم

مترجم: سید‌حسین علوی لنگرودی alavitarjomeh@gmail.com اگر قرار باشد برای ترجمه مطالب از ماشین استفاده کنید، بهترین راه برای آموزش آن چیست؟ اگر بخواهید برای این کار برنامه هوش مصنوعی روان‌شناسانه را دنبال کنید، لازم است تعدادی از مترجمان حرفه‌‌‌ای و کاربلد را در یک اتاق دور هم جمع کرده و تلاش کنید ادراک و دانش آنها در زمینه ترجمه را به تعدادی قانون و دستورالعمل مرتبط با چگونگی فهم و تفسیر متون تبدیل کنید و در قالب یک نرم‌‌‌افزار واحد درآورید. اما تجربه نشان داده است که این ترفند کارگر نمی‌‌‌افتد؛ چراکه زبان یک سیستم تشکیل‌شده از یک‌سری قواعد تعریف‌شده و قطعی نیست.

هوش مصنوعی نمی‌تواند مترجم خیلی خوبی باشد!

در واقع لغات دارای یک معنی واحد نیستند، بلکه معانی مختلف و متفاوتی دارند که با توجه ‌‌‌به متن و موقعیت آنها در جملات، یکی از آنها به‌‌‌عنوان معنی درست انتخاب و استفاده می‌شود. بنابراین فقط نمی‌توان با جست‌‌‌وجوی معنی یک لغت در دیکشنری به نتیجه رسید، بلکه باید بر اساس جمله و همچنین با توجه ‌‌‌به شناختی که از نویسنده یا گوینده وجود دارد در مورد معنی کلمات تصمیم گرفت.

حال اگر بخواهیم هنر مترجمان را نادیده گرفته و از ماشین‌‌‌ها برای ترجمه کمک بگیریم، چاره‌‌‌ای جز کمک‌‌‌ گرفتن از مهندسان نرم‌‌‌افزار برای جمع‌‌‌آوری و تحلیل میلیون‌‌‌ها لغت و جمله و استخراج یک‌سری قواعد و قوانین مخصوص ترجمه نخواهیم داشت. تا اواخر دهه ۱۹۸۰ پیشرفت چندانی در زمینه ترجمه ماشینی صورت نگرفت و بسیاری از نهادها و دولت‌‌‌ها سرمایه‌گذاری در این زمینه را بیهوده و مسخره می‌‌‌دانستند.

داستان خنده‌داری در مورد ترجمه ماشینی وجود دارد که اغلب مخالفان این نوع ترجمه، آن را نقل می‌کنند: در اواخر دهه ۱۹۹۰ که گام‌‌‌های اولیه در زمینه طراحی برنامه‌‌‌های کامپیوتری ترجمه برداشته شد، تیتر اول یک روزنامه برای ترجمه به کامپیوتر داده شد که می‌‌‌گفت:

POP SHOT. WORLD SHAKEN

در آن زمان کامپیوتر این جمله را این‌‌‌گونه ترجمه کرد: زلزله در ایتالیا. یک نفر مرد

جالب است بدانید همین جمله را در سال ۲۰۲۰ که پیشرفت‌‌‌های بسیار خوبی در زمینه ترجمه ماشینی تا آن زمان به وقوع پیوست گوگل ترنسلیت این گونه معنی کرد: پاپ فریاد زد. دنیا تکان خورد.

در این جمله ما با کلمه‌‌‌ای مواجه هستیم به نام SHOT که دارای دو معنی اصلی در انگلیسی است: یکی شلیک ‌‌‌کردن و دوم فریاد زدن. حال اگر ماشین این جمله را به‌‌‌صورت «پاپ شلیک کرد. دنیا تکان خورد» یا «پاپ فریاد زد. دنیا تکان خورد» ترجمه کند، به ‌‌‌ظاهر ترجمه درستی صورت‌‌‌ گرفته است.

حال ‌‌‌آنکه بر اساس استدلال انسانی معقول به نظر نمی‌رسد که دنیا به ‌‌‌خاطر فریاد زدن پاپ بر سر یک نفر به هم بریزد و تکان بخورد. علاوه بر این چندان معقول و منطقی به نظر نمی‌رسد که فردی مثل پاپ به فردی دیگر شلیک کند و چنین اقدامی از پاپ بعید به نظر می‌‌‌رسد. اما مترجم می‌‌‌داند آنچه می‌تواند دنیا را شوکه کند و تکان دهد شلیک به پاپ و سوءقصد به جان اوست و بنابراین ترجمه درست تیتر بالا توسط یک انسان می‌تواند این باشد: «سوء قصد به پاپ، دنیا را تکان داد.»

برای حل ابهام و چندمعنایی در ترجمه به عقل سلیم نیاز است. فقدان عقل سلیم یکی از مشکلات اصلی تمام سیستم‌های ترجمه محسوب می‌شود.

با این ‌‌‌همه، تلاش‌‌‌های زیادی انجام شده است تا این نقیصه برطرف شود و ترجمه ماشینی به شکل معنادارتری صورت پذیرد. به‌‌‌ عنوان ‌‌‌مثال، سیستم ترجمه DeepL که به‌‌‌عنوان یکی از قدرتمندترین و کم‌‌‌نقص‌‌‌ترین سیستم‌های ترجمه در جهان شناخته می‌شود، به‌‌‌گونه‌‌‌ای طراحی شده است که می‌تواند توالی‌‌‌های لغات و همچنین معنی کل جملاتی را که قرار است با هم ترجمه شوند

در نظر بگیرد و فقط به دنبال ترجمه کلمه ‌‌‌به ‌‌‌کلمه و با کمک دیکشنری نباشد. به‌‌‌عنوان نمونه، DeepL جمله مورد اشاره در قسمت بالا را این گونه ترجمه کرده است: «شلیک به پاپ دنیا را تکان داد» که ترجمه خوبی به نظر می‌‌‌رسد.

این پیشرفت در نگاه اول یک جهش بزرگ و امیدوارکننده به نظر می‌رسد که تا حدی چنین نیز هست. اما برای ترجمه مطلوب توسط ماشین کافی نیست، چراکه در اینجا هم اتکای ماشین برای ترجمه سایر لغات و جملات همان داده‌‌‌های موجود در اینترنت یا همان ترجمه‌‌‌های احتمالا نادرستی است که از آن لغات و جملات وجود دارد. همین ترجمه‌‌‌های بی‌‌‌کیفیت و نادرست است که کیفیت ترجمه نهایی انجام‌شده توسط ماشین‌‌‌هایی مانند DeepL را کاهش می‌دهد. در واقع باید گفت اگرچه برنامه‌‌‌های ترجمه امروزی خیلی خوب و موفق هستند و کیفیت بسیار خوبی دارند؛ اما این به آن معنا نیست که عقل سلیم دارند. زبان‌‌‌های طبیعی برخلاف زبان‌‌‌های منطقی دارای منابع مختلف ابهام و پوشیدگی هستند که یکی از این منابع ابهام در زبان‌‌‌های طبیعی وجود چندمعنایی در آنهاست. همه ما می‌‌‌دانیم که یک کلمه واحد می‌تواند دارای معانی متعددی باشد که باتوجه‌‌‌به موقعیت و با استفاده از عقل سلیم باید یکی از آنها را انتخاب و استفاده کرد. به‌عنوان مثال، به جمله زیر که نمونه‌‌‌ای است از پیامد نبود عقل سلیم در ترجمه ماشینی توجه کنید:

Little John was looking for his toy box. Finally, he found it. The box was in the pen. John was very happy.

تمام کسانی که با زبان انگلیسی آشنایی دارند یک ترجمه رایج و بسیار پرکاربرد از کلمه pen را در ذهن دارند که همان خودکار است که البته می‌توان فهمید این معنی کلمه pen نمی‌تواند در این جمله به کار گرفته شود، چرا که جعبه اسباب‌‌‌بازی جان که ابعاد بزرگی دارد نمی‌تواند در داخل یک خودکار کوچک قرار داشته باشد.

در واقع معنی کمتر شناخته‌شده و کم‌‌‌کاربرد کلمهpen یعنی محوطه یا چهاردیواری کوچک در این جمله باید مدنظر باشد که این تشخیص با کمک عقل سلیم اتفاق می‌‌‌افتد. اما اگر از برنامه‌‌‌های ترجمه خواسته شود جمله بالا را ترجمه کنند، خروجی کار چندان خوب از آب درنمی‌‌‌آید؛ چراکه اغلب برنامه‌‌‌ها ترجمه «جعبه در داخل خودکار بود» را پیشنهاد می‌دهند که ترجمه‌‌‌ای بی‌‌‌معنی و کاملا غلط است. البته وقتی این جمله برای ترجمه به برنامه DeepL داده شد، طبق انتظار ترجمه ظاهرا بهتری پیشنهاد شد: «جعبه در آغل بود.» اما مشکل این ترجمه به کلمه آغل مربوط می‌شود که جایی است برای نگهداری گوسفندان و وجود جعبه اسباب‌‌‌بازی بچه‌‌‌ها در آنجا بر اساس عقل سلیم چندان معقول و منطقی به نظر نمی‌‌‌رسد.

منبع: کتاب The age of AI: and our human future