تغییر جهان با تحلیل بزرگ داده‌ها

دنیای اقتصاد: بزرگ‌داده (big Data) عبارتی است که مدت‌هاست درباره آن می‌شنویم، اما هنوز ابهاماتی در رابطه با ماهیت این بزرگ‌داده‌ها وجود دارند. در حقیقت، بزرگ‌داده‌ها نیروی محرکه اصلی در ظهور تکنولوژی‌های جدید از جمله هوش مصنوعی، علم دیتا و اینترنت اشیا (IoT) در عصر دگرگونی دیجیتالی هستند. با درنظر گرفتن این تعاریف، ما نیز تصمیم به انتشار تعریفی جامع و ابتدایی از ماهیت بزرگ‌داده‌ها در سال ۲۰۱۷ گرفتیم. همانند گذشته، این آموزش نیز به‌صورت کاملا جامع و با قصد توصیف مفاهیم اصولی بدون توجه به دانش قبلی خوانندگان درباره بزرگ‌داده‌ها تهیه و تنظیم شده است. همه چیز با آغاز عصر داده‌ها و تحول عظیم در حجم داده‌های تولیدی آغاز شد. این گسترش حجم داده‌ها به علت توسعه کامپیوترها، اینترنت و تکنولوژی که قادر است اطلاعات را از دنیای واقعی و فیزیکی دریافت و آنها را به داده‌های دیجیتال تبدیل کند، به‌وجود آمد.

امروزه، هر بار که آنلاین می‌شویم‌، هربار که گوشی‌های هوشمند مجهز به GPS را با خودمان حمل می‌کنیم، هربار که از طریق رسانه‌های اجتماعی و اپلیکیشن‌های چت با دوستانمان ارتباط برقرار می‌کنیم و حتی زمانی که خرید می‌کنیم، در اصل دیتای جدید تولید می‌کنیم. بهتر است بگوییم هر عملی که شامل انجام فعالیت‌های دیجیتالی شود، ردپای دیجیتالی کاربر را در آنجا بر جای خواهد گذاشت. موضوع مهم‌تر مقدار داده‌های تولید شده از سوی ماشین‌ها است که با سرعت بسیار زیاد در حال افزایش است. زمانی که تجهیزات هوشمند منازل با یکدیگر یا با سرور مرکزی منزل ارتباط برقرار می‌کنند، داده‌ها تولید و به اشتراک گذاشته می‌شود. در سراسر دنیا، هر روز تعداد بیشتری از ماشین‌آلات صنعتی کارخانه‌ها به سنسورهایی که داده‌ها را مخابره می‌کنند، مجهز می‌شوند. به زودی نیز خودروهای بدون راننده به خیابان‌ها می‌آیند و به سرعت نقشه‌ چهاربعدی فضای اطراف خودرو را به سرورهای مرکزی انتقال خواهند داد.

وظیفه بزرگ‌داده‌ها چیست؟

اطلاعات روزافزون به‌دست آمده از سنسورها، تصاویر، متن، اطلاعات صوتی و ویدئویی، همگی تشکیل‌دهنده‌ بزرگ‌داده‌هایی هستند که امروزه می‌توانیم از آنها به روش‌هایی که چند سال پیش غیرممکن بود، استفاده کنیم. در حال حاضر، پروژه‌های مرتبط با تحلیل بزرگ‌داده‌ها در بخش‌های زیر در حال کمک‌رسانی هستند.

درمان بیماری‌ها و جلوگیری از سرطان: داروهای داده محور (Data-Driven) شامل تحلیل حجم گسترده‌ای از سوابق دارویی برای یافتن الگوهای با قابلیت کمک به دانشمندان برای شناسایی بیماری‌ها در مراحل ابتدایی و تولید داروهای جدید می‌شود.

غذارسانی به گرسنگان: به لطف داده‌ها، کشاورزی در حال متحول شدن است و به زودی با استفاده از بزرگ‌داده‌ها می‌توان تولید محصولات را به حداکثر و حجم آلاینده‌های ورودی به محیط زیست را به حداقل رساند و استفاده از ماشین‌ها و ابزارآلات را بهینه‌سازی کرد.

جست‌وجوی سیاره‌های دوردست: ناسا با آنالیز میلیون‌ها داده از آنها برای مدل‌سازی تمامی امکانات ممکن برای فرود مریخ‌نوردهای خود روی این سیاره و برنامه‌ریزی جهت انجام ماموریت‌های آینده استفاده می‌کند.

پیش‌بینی و مقابله با بلایای طبیعی و انسانی: با تحلیل داده‌های به دست آمده از سنسورها می‌توان محل احتمالی زمین‌لرزه‌های بعدی را پیش‌بینی و با آنالیز الگوهای رفتاری انسان‌ها می‌توان به سرنخ‌هایی که قادر است به سازمان‌ها برای نجات جان افراد و کمک‌رسانی بیشتر به بازماندگان کمک کنند، دست پیدا کرد. همچنین با به‌کارگیری تکنولوژی تحلیل بزرگ‌داده‌ها می‌توان برای حفاظت از جان مهاجران در مناطق جنگی سراسر دنیا استفاده کرد.

جلوگیری از وقوع جرم: نیروهای پلیس بر اساس استراتژی‌های برگرفته شده از داده‌های قبلی و مجموعه داده‌های عمومی، قادر خواهند بود نیروهای خود را موثرتر وارد عملیات کرده و در مواقع ضروری با بازدارندگی بیشتری در مقابل مجرمان وارد عمل شوند. همچنین به لطف وجود بزرگ‌داده‌ها، امکان خرید آنلاین، انتخاب بهترین وسیله و مکان برای سفر، انتخاب بهترین زمان برای رزرو بلیت هواپیما و تصمیم‌گیری برای انتخاب فیلم مناسب برای تماشا در سینما و در کل زندگی به شکل ساده‌ و راحت‌تر امکان‌پذیر شده است. قاعده اصلی بزرگ‌داده‌ها به این شکل است که هرچه بیشتر درمورد یک مساله یا یک موقعیت اطلاعات به‌دست بیاورید، بینش درونی شما نسبت به آن بیشتر و پیش‌بینی‌های شما درباره اتفاقات بعدی با اطمینان بیشتری حاصل می‌شود.

با مقایسه داده‌ها، روابطی که در گذشته غیرقابل تشخیص بود کم‌کم آشکار می‌شوند و در ادامه، این روابط درک و آگاهی ما از تصمیمات آینده را برایمان امکان پذیر خواهند کرد. عموما‌، این نتایج از طریق مدل‌سازی بر اساس داده‌های جمع‌آوری شده، انجام مراحل شبیه‌سازی، محاسبه مقدار داده‌ها در هر مرحله و بررسی تاثیر آنها روی نتایج کسب شده، به‌دست می‌آیند. امروزه این مراحل به‌صورت اتوماتیک و از طریق تکنولوژی‌های تحلیلی پیشرفته انجام می‌گیرد که قادرند شبیه‌سازی را میلیون‌ها‌بار به‌صورت مکرر انجام دهند و تمامی متغیرها را تا زمانی که به یک الگوی قابل‌فهم دست پیدا کنند، جابه‌جا کنند و از این طریق مساله‌ مورد نظر را در مدت کوتاهی حل کنند.

هرروز، داده‌ها به شکل سازمان‌دهی نشده وارد زندگیمان می‌شوند. منظور از سازماندهی نشده این است که نمی‌توان آنها را به راحتی در جدول‌های دسته‌بندی شده قرار داد. بخش اعظم این داده‌ها به شکل تصاویر و ویدئوهایی هستند که از تصاویر به‌دست آمده از ماهواره‌ها گرفته تا عکس‌های آپلود شده در فیس‌بوک و توییتر را تشکیل می‌دهند. ایمیل‌‌ها، پیام‌های متنی اپیلیکیشن‌های پیام‌رسان و مکالمات تلفنی ضبط شده نیز بخش دیگر این داده‌ها را تشکیل می‌دهند. برای درک تمامی این داده‌ها، پروژه‌های تحلیلی بزرگ‌داده‌ها با استفاده از به‌روزترین تکنولوژی‌های تحلیل اطلاعات از جمله هوش مصنوعی و یادگیری ماشینی انجام می‌شوند. با آموزش کامپیوترها به منظور درک این داده‌ها از طریق تشخیص تصاویر و پردازش به زبان طبیعی، کامپیوترها می‌توانند الگوها را با سرعت و اطمینان بیشتری نسبت به انسان‌ها تشخیص دهند.

روند پیش‌گرفته شده در چند سال اخیر موجب پیشرفت‌های چشمگیری در این زمینه و ارائه ابزارهای تحلیل بزرگ‌داده‌ها به‌عنوان پلت‌فرمی برای خدمت‌رسانی شده است. سازمان‌ها و شرکت‌ها فضای سرور، سیستم‌های نرم‌افزاری و پردازشگرها را از ارائه‌دهندگان سرویس‌های کلود اجاره می‌کنند. تمامی مراحل تحلیل داده‌ها از طریق سیستم‌های شرکت ارائه‌دهنده این سرویس‌ها انجام می‌شود و مشتریان تنها هزینه انجام آن را پرداخت می‌کنند. این نوع همکاری‌ها، تحلیل و تبدیل بزرگ‌داده‌ها را برای تمامی سازمان‌ها ممکن ساخته و از صرف هزینه‌های هنگفت برای خرید سخت‌افزار، نرم‌افزار و استخدام کارکنان تخصصی جدید جلوگیری می‌کند.

نگرانی‌ها درباره بزرگ‌داده‌ها

امروزه، بزرگ‌داده‌ها بینش و فرصت‌های بی‌سابقه‌ای را در اختیارمان قرار می‌دهند اما در این میان سوالات و نگرانی‌هایی وجود دارند که باید به آنها اشاره کرد.

حریم خصوصی داده‌ها: بزرگ‌داده‌هایی که امروزه تولید می‌کنیم حاوی حجم زیادی از اطلاعات زندگی شخصی افراد که باید در حریم خصوصی محافظت شوند، هستند. در حال حاضر هم اطلاعات خصوصی افراد را فاش می‌کنیم و هم از فضای راحتی که برنامه‌ها و سرویس‌های مرتبط با بزرگ‌داده‌ها فراهم کرده‌اند استفاده می‌کنیم. حقیقتا چه کسی اجازه دسترسی به این اطلاعات را دارد؟

امنیت داده‌ها: حتی اگر با به‌کارگیری اطلاعاتمان برای مقاصد به‌خصوص مشکلی نداشته باشیم، آیا حفظ این اطلاعات توسط افراد تضمین می‌شود؟ آیا قوانین و مقررات مرتبط با حفظ اطلاعات خصوصی برای این مقیاس از داده‌ها نیز کاربرد دارند؟

تبعیض اطلاعاتی: زمانی که همه‌چیز مشخص شد، آیا تبعیض قائل شدن برای برخی افراد بر اساس اطلاعاتی که از زندگی شخصی آنها به دست آورده‌ایم قابل قبول خواهد بود؟ در حال حاضر، بانک‌ها بر اساس رده‌بندی اعتبار افراد، تصمیم می‌گیرند که به چه افرادی وام اعطا کنند و سازمان‌های بیمه ‌نیز شدیدا به داده‌ها اتکا کرده‌اند. باید انتظار داشته باشیم که اطلاعات با جزئیات گسترده‌تری ارزیابی و تحلیل شوند و از اینکه در اختیار داشتن اطلاعات فردی موجب سخت‌تر شدن معیشت افرادی که از منابع و دسترسی به اطلاعات محدودتری برخوردارند نمی‌شود، اطمینان حاصل کنیم.

مواجهه با چنین چالش‌هایی، بخشی از مشکلات بزرگ‌داده‌ها محسوب می‌شوند. بدون شک اختلافات گسترده‌ای بین دانشمندان و متفکران دانشگاه‌ها وجود دارد و افرادی که قصد استفاده از بزرگ‌داده‌ها را دارند، باید از مخاطرات و ایرادات این کار از سوی این افراد باخبر شوند. در غیر این صورت، کسب‌و‌کارها با صدمات جدی روبه‌رو شده و در ادامه بحران‌های مالی و جریمه‌های سنگین را به همراه خواهد داشت. اوایل که افراد درباره بزرگ‌داده‌ها صحبت می‌کردند، بسیاری آن را تکنولوژی زودگذری می‌دانستند که قرار است تنها برای مدتی کوتاه مورد توجه قرار بگیرد و زمانی که تکنولوژی جدیدتری ظهور کند، بزرگ‌داده‌ها نیز فراموش می‌شوند. اما تا به امروز چنین اتفاقی نیفتاده است و در حقیقت، با ظهور تکنولوژی‌های جدید، می‌بینیم که نیروی محرکه اصلی تمامی آنها بزرگ‌داده‌ها هستند. در آینده نزدیک، مقدار داده‌های در اختیار ما گسترش پیدا می‌کنند و تکنولوژی‌های تحلیل داده‌ها نیز پیشرفته‌تر می‌شوند. پس اگر بزرگ‌داده‌ها امروزه قادر به انجام چنین کارهای بزرگی هستند، تصور کنید در آینده قادر به انجام چه کارهای بزرگ‌تری خواهند بود.