تحولات بنیادی در عصر داده‌های بزرگ

مترجم: امیر‌علی رمدانی منبع:کتاب هوش مصنوعی در محیط کار : از اواخر دهه ۲۰۰۰ تا سال ۲۰۱۹ هیجان‌ها نسبت به هوش مصنوعی به تب شدیدی تبدیل شد، به نحوی که سبب تغییر نگرش‌ها نسبت به آن شد و بار دیگر چشم‌انداز هوش‌ مصنوعی به‌طور اساسی تغییر کرد. اما این‌ تغییر چشم‌انداز بر خلاف دهه ۱۹۸۰، تغییر به نفع رشد بلندمدت هوش مصنوعی و رشد صنعت فناوری‌های مرتبط با هوش مصنوعی است. این تغییرات نه تنها قرار است به گسترش هوش مصنوعی کمک کند بلکه قرار است هوش مصنوعی را به یک ضرورت بدل سازد.

استفاده از هوش مصنوعی به عنوان یک کاربرد نوظهور که گهگاهی معرفی می‌شد تغییر کرد و هوش مصنوعی به عنوان یکی از ارکان اساسی که در تار و پود تمام کارهای آینده وجود خواهد داشت مطرح شد. همین حالا می‌توانیم چنین رخدادی را به وضوح در گوشی‌های هوشمند ببینیم که تراشه‌های اختصاصی برای محاسبات هوش مصنوعی در آنها تعبیه شده‌اند. اگر این قابلیت‌ها خاموش شوند حتی نمی‌توانیم قفل گوشی را باز کنیم (تشخیص چهره) یا با آنها متن بنویسیم (پیش‌بینی متن در زمان نوشتن).

حداقل سه نیروی محرکه به‌کارگیری تکنیک‌های هوش مصنوعی به یک ضرورت تبدیل خواهند شد. موضوع اول؛ اینکه ما در میزان داده‌ای که باید مدیریت شوند افزایش بی‌سابقه‌ای داشته‌ایم و باید به دقت آنها را سازماندهی و براساس آنها تصمیمات را اتخاذ کنیم. موضوع دوم؛ توان پردازشی که طی ۵۰ سال گذشته از قانون «مور» پیروی کرده، اکنون به‌کارگیری الگوریتم‌های پیچیده را برای داده‌ها امکان‌پذیر ساخته است. عملکرد این الگوریتم‌ها (در حوزه‌های با محدوده‌های مشخص) در امتداد توانایی‌های انسان بوده است. در کمترین حالت ممکن است این الگوریتم‌ها سبب ایجاد ابزارهای همکاری مفیدی ‌شوند که می‌توانند قابلیت‌های انسانی را افزایش دهند. موضوع سوم؛ رایانش ابری است که هم فضای ذخیره‌سازی و هم توان پردازشی را به صورت گسترده در دسترس قرار داده. بنابراین هر فردی می‌تواند به ابزارهای پیچیده هوش مصنوعی دسترسی داشته باشد و از آنها استفاده کند. ابزارهای متن‌باز نیز همین اقدامات را با قابلیت‌های سطح پایین‌تر انجام می‌دهند. هوش مصنوعی به گونه‌ای محبوب همگان شده که قبل از این، چنین موردی را شاهد نبوده‌ایم.

اولین تحول بنیادی، آن است که میزان و اندازه فعالیت‌های ما با داده‌ها تغییر کرده است. داده‌ها همیشه تولید می‌شدند. سوال اینجا بود که آیا می‌شود همه آنها را دریافت، ذخیره‌سازی، بازیابی و تحلیل کرد؟ در سال‌های اخیر نسبت به این دیدگاه چالش‌های بزرگی ایجاد شد. اکنون می‌توانیم به صورت مقرون به صرفه‌ای میزان بسیار زیادی از داده‌ها را ذخیره‌سازی کنیم (گرچه بیشتر آنها هنوز داده‌های ساختار‌نیافته هستند) و می‌توانیم بخش بزرگی از این داده‌های ذخیره‌سازی شده را تحلیل کنیم.

اگر سری به سایت internetlivestats.com بزنید، تعداد حیرت‌انگیزی از اعداد را می‌بینید که به سرعت تغییر و افزایش پیدا می‌کنند. وقتی یک روز صبح از ماه سپتامبر سال ۲۰۱۹ از مرکز اروپا این سایت را بررسی کردم، اعداد نمایش داده شده به شکل زیر بودند: «بیش از ۱۱۵‌میلیارد ایمیل در آن روز فرستاده شده بود؛ بیش از ۳۵‌میلیون عکس در اینستاگرام بارگذاری شده بود؛ بیش از ۳‌میلیاردجست‌وجو در سایت گوگل انجام شده بود.»

حالا دیگر استفاده از واژه‌هایی مثل «سیل» یا «غرق شدن در داده‌ها» برای تشریح وضعیت حال حاضر اغراق‌آمیز نیست. بنابر تحقیقی که به وسیله وب‌سایت Raconteur انجام شده، احتمالا ما در سال ۲۰۲۵ به حجم داده تولیدی ۴۶۳ اگزابایت در روز می‌رسیم. درک اینکه ۴۶۳ اگزابایت داده چه حجمی دارد دشوار است. بنابر گزارش سال ۲۰۱۳ دانشگاه برکلی، تمام کلماتی که تا به حال به وسیله انسان‌ها بیان شده حداکثر ۵ اگزابایت فضا اشغال می‌کند. بنابراین ما ۹۳ برابر این مقدار داده را هر روزه تولید خواهیم کرد . افزایش حجم زیاد داده‌های تولیدی، ناشی از افزایش دستگاه‌هایی است که در ابزارهای پوشیدنی، دستگاه‌های هوشمند خانه‌ها و صنعت به اینترنت اشیا متصل می‌شوند. فرصت ایجاد شده توسط هوش مصنوعی بیان‌کننده این است که انسان‌ها به هیچ روش، شکل و ابعادی نمی‌توانند انتظار داشته باشند که حتی بخش کوچکی از این داده‌ها را بدون اتوماسیون تحلیل کنند. تنها امید ما به‌کارگیری تحلیل‌های مقیاس بزرگ برای داده‌ها است. اگر یک گام جلوتر برویم، می‌توانیم انتظار داشته باشیم که تا زمان جا افتادن تصمیم‌گیری خودکار در سیستم‌ها، قادر به کنار آمدن با رشد تقاضا برای تصمیم‌گیری نخواهیم بود. برای بررسی برخی از نیازهای حیرت‌انگیزی که بشر خواهد داشت، مثالی را از بخش آموزش بیان می‌کنیم. مطابق با اهدافی که مجمع عمومی سازمان ملل اتخاذ کرده، برای اینکه در سال ۲۰۳۰ هدف ارائه آموزش‌های ابتدایی تا قبل دانشگاه به تمام کودکان محقق شود به ۶۹ میلیون معلم دیگر در سراسر جهان نیاز داریم. در سال ۲۰۱۸، ۶۴ میلیون معلم در سراسر جهان وجود داشتند. این امر صرف نظر از معضلات کیفی مانند سطح آموزش خود معلمان است. برای آموزش تعداد معلمان کافی و رسیدن به اهداف خود، به میزان زیادی از پشتیبانی فناوری به منظور مقیاس‌پذیری آموزش معلمان، مقیاس‌پذیری آموزش شاگردان و دقیق‌تر از آن سنجش نتایج نیاز داریم. تمام این موارد وابسته به مدیریت موثر داده‌ها و فرآیندهای اتوماسیون هستند که به منابع انسانی اجازه دهند بر کاری که تخصص دارند، یعنی تعاملات انسان با انسان تمرکز کنند.

در چین، شرکتی به نام Squirrel AI توانسته طی دو سال بیش از ۷۰۰ مدرسه برای آموزش دوره ۱۲ ساله کودکان بسازد که بیش از یک‌ میلیون دانش‌آموز را پوشش می‌دهد. کل سامانه به الگوریتم‌های پیچیده‌ای وابسته است که می‌توانند برنامه آموزشی را با نیازهای فردی دانش‌آموزان تطبیق دهند. شک داشتن به اینکه چطور این سامانه‌ها واقعا قرار است بر کودکان و آموزش آنها تاثیر داشته باشند منطقی است، اما در عین حال مجبوریم بپذیریم که چنین راهکارهایی تنها راه برای مدیریت رشد جمعیت و رشد نیازهای آموزشی است. استفاده از پردازنده‌های گرافیکی به‌همراه پیشرفت‌های طراحی الگوریتم‌ها (به خصوص از سوی گروه جئوفری هینتون در دانشگاه تورنتو) منجر به تغییر بزرگی در کیفیت نتایج و تلاش برای رسیدن به این نتایج شد. این دو پیشرفت به روش‌های مختلف سبب آغاز این فرآیند توقف‌ناپذیر شدند. هوش مصنوعی به عنوان یک صنعت ممکن است در برخی نقاط با مشکل مواجه شده باشد، سرمایه‌گذاران آن ناراضی باشند و شاید نتوانسته تمام آن چیزهایی را که وعده داده بود محقق کند، اما به هر حال تکنیک‌هایی که تا به حال توسعه داده شده‌اند همیشه در دسترس هستند و به خاطر کاربردپذیری گسترده‌ای که دارند همیشه برای حل مسائل به‌کار خواهند رفت و حتی فراتر از آن به گونه‌ای که می‌بینیم دسترسی به هوش مصنوعی از طریق رایانش ابری و نرم‌افزارهای متن‌باز محبوبیت بسیاری پیدا کرده است.