تحولات بنیادی در عصر دادههای بزرگ
استفاده از هوش مصنوعی به عنوان یک کاربرد نوظهور که گهگاهی معرفی میشد تغییر کرد و هوش مصنوعی به عنوان یکی از ارکان اساسی که در تار و پود تمام کارهای آینده وجود خواهد داشت مطرح شد. همین حالا میتوانیم چنین رخدادی را به وضوح در گوشیهای هوشمند ببینیم که تراشههای اختصاصی برای محاسبات هوش مصنوعی در آنها تعبیه شدهاند. اگر این قابلیتها خاموش شوند حتی نمیتوانیم قفل گوشی را باز کنیم (تشخیص چهره) یا با آنها متن بنویسیم (پیشبینی متن در زمان نوشتن).
حداقل سه نیروی محرکه بهکارگیری تکنیکهای هوش مصنوعی به یک ضرورت تبدیل خواهند شد. موضوع اول؛ اینکه ما در میزان دادهای که باید مدیریت شوند افزایش بیسابقهای داشتهایم و باید به دقت آنها را سازماندهی و براساس آنها تصمیمات را اتخاذ کنیم. موضوع دوم؛ توان پردازشی که طی ۵۰ سال گذشته از قانون «مور» پیروی کرده، اکنون بهکارگیری الگوریتمهای پیچیده را برای دادهها امکانپذیر ساخته است. عملکرد این الگوریتمها (در حوزههای با محدودههای مشخص) در امتداد تواناییهای انسان بوده است. در کمترین حالت ممکن است این الگوریتمها سبب ایجاد ابزارهای همکاری مفیدی شوند که میتوانند قابلیتهای انسانی را افزایش دهند. موضوع سوم؛ رایانش ابری است که هم فضای ذخیرهسازی و هم توان پردازشی را به صورت گسترده در دسترس قرار داده. بنابراین هر فردی میتواند به ابزارهای پیچیده هوش مصنوعی دسترسی داشته باشد و از آنها استفاده کند. ابزارهای متنباز نیز همین اقدامات را با قابلیتهای سطح پایینتر انجام میدهند. هوش مصنوعی به گونهای محبوب همگان شده که قبل از این، چنین موردی را شاهد نبودهایم.
اولین تحول بنیادی، آن است که میزان و اندازه فعالیتهای ما با دادهها تغییر کرده است. دادهها همیشه تولید میشدند. سوال اینجا بود که آیا میشود همه آنها را دریافت، ذخیرهسازی، بازیابی و تحلیل کرد؟ در سالهای اخیر نسبت به این دیدگاه چالشهای بزرگی ایجاد شد. اکنون میتوانیم به صورت مقرون به صرفهای میزان بسیار زیادی از دادهها را ذخیرهسازی کنیم (گرچه بیشتر آنها هنوز دادههای ساختارنیافته هستند) و میتوانیم بخش بزرگی از این دادههای ذخیرهسازی شده را تحلیل کنیم.
اگر سری به سایت internetlivestats.com بزنید، تعداد حیرتانگیزی از اعداد را میبینید که به سرعت تغییر و افزایش پیدا میکنند. وقتی یک روز صبح از ماه سپتامبر سال ۲۰۱۹ از مرکز اروپا این سایت را بررسی کردم، اعداد نمایش داده شده به شکل زیر بودند: «بیش از ۱۱۵میلیارد ایمیل در آن روز فرستاده شده بود؛ بیش از ۳۵میلیون عکس در اینستاگرام بارگذاری شده بود؛ بیش از ۳میلیاردجستوجو در سایت گوگل انجام شده بود.»
حالا دیگر استفاده از واژههایی مثل «سیل» یا «غرق شدن در دادهها» برای تشریح وضعیت حال حاضر اغراقآمیز نیست. بنابر تحقیقی که به وسیله وبسایت Raconteur انجام شده، احتمالا ما در سال ۲۰۲۵ به حجم داده تولیدی ۴۶۳ اگزابایت در روز میرسیم. درک اینکه ۴۶۳ اگزابایت داده چه حجمی دارد دشوار است. بنابر گزارش سال ۲۰۱۳ دانشگاه برکلی، تمام کلماتی که تا به حال به وسیله انسانها بیان شده حداکثر ۵ اگزابایت فضا اشغال میکند. بنابراین ما ۹۳ برابر این مقدار داده را هر روزه تولید خواهیم کرد . افزایش حجم زیاد دادههای تولیدی، ناشی از افزایش دستگاههایی است که در ابزارهای پوشیدنی، دستگاههای هوشمند خانهها و صنعت به اینترنت اشیا متصل میشوند. فرصت ایجاد شده توسط هوش مصنوعی بیانکننده این است که انسانها به هیچ روش، شکل و ابعادی نمیتوانند انتظار داشته باشند که حتی بخش کوچکی از این دادهها را بدون اتوماسیون تحلیل کنند. تنها امید ما بهکارگیری تحلیلهای مقیاس بزرگ برای دادهها است. اگر یک گام جلوتر برویم، میتوانیم انتظار داشته باشیم که تا زمان جا افتادن تصمیمگیری خودکار در سیستمها، قادر به کنار آمدن با رشد تقاضا برای تصمیمگیری نخواهیم بود. برای بررسی برخی از نیازهای حیرتانگیزی که بشر خواهد داشت، مثالی را از بخش آموزش بیان میکنیم. مطابق با اهدافی که مجمع عمومی سازمان ملل اتخاذ کرده، برای اینکه در سال ۲۰۳۰ هدف ارائه آموزشهای ابتدایی تا قبل دانشگاه به تمام کودکان محقق شود به ۶۹ میلیون معلم دیگر در سراسر جهان نیاز داریم. در سال ۲۰۱۸، ۶۴ میلیون معلم در سراسر جهان وجود داشتند. این امر صرف نظر از معضلات کیفی مانند سطح آموزش خود معلمان است. برای آموزش تعداد معلمان کافی و رسیدن به اهداف خود، به میزان زیادی از پشتیبانی فناوری به منظور مقیاسپذیری آموزش معلمان، مقیاسپذیری آموزش شاگردان و دقیقتر از آن سنجش نتایج نیاز داریم. تمام این موارد وابسته به مدیریت موثر دادهها و فرآیندهای اتوماسیون هستند که به منابع انسانی اجازه دهند بر کاری که تخصص دارند، یعنی تعاملات انسان با انسان تمرکز کنند.
در چین، شرکتی به نام Squirrel AI توانسته طی دو سال بیش از ۷۰۰ مدرسه برای آموزش دوره ۱۲ ساله کودکان بسازد که بیش از یک میلیون دانشآموز را پوشش میدهد. کل سامانه به الگوریتمهای پیچیدهای وابسته است که میتوانند برنامه آموزشی را با نیازهای فردی دانشآموزان تطبیق دهند. شک داشتن به اینکه چطور این سامانهها واقعا قرار است بر کودکان و آموزش آنها تاثیر داشته باشند منطقی است، اما در عین حال مجبوریم بپذیریم که چنین راهکارهایی تنها راه برای مدیریت رشد جمعیت و رشد نیازهای آموزشی است. استفاده از پردازندههای گرافیکی بههمراه پیشرفتهای طراحی الگوریتمها (به خصوص از سوی گروه جئوفری هینتون در دانشگاه تورنتو) منجر به تغییر بزرگی در کیفیت نتایج و تلاش برای رسیدن به این نتایج شد. این دو پیشرفت به روشهای مختلف سبب آغاز این فرآیند توقفناپذیر شدند. هوش مصنوعی به عنوان یک صنعت ممکن است در برخی نقاط با مشکل مواجه شده باشد، سرمایهگذاران آن ناراضی باشند و شاید نتوانسته تمام آن چیزهایی را که وعده داده بود محقق کند، اما به هر حال تکنیکهایی که تا به حال توسعه داده شدهاند همیشه در دسترس هستند و به خاطر کاربردپذیری گستردهای که دارند همیشه برای حل مسائل بهکار خواهند رفت و حتی فراتر از آن به گونهای که میبینیم دسترسی به هوش مصنوعی از طریق رایانش ابری و نرمافزارهای متنباز محبوبیت بسیاری پیدا کرده است.