5 مشکل و خطر استفاده از کلان داده‌ها

برنارد میر 

همانند هر کسب و کار دیگری، پروژه‌های مربوط به کلان داده نیز عنصری از ریسک در دل خود دارند. هر پروژه می‌تواند به چند دلیل شکست بخورد: مدیریت ضعیف، بودجه کم و ناکافی یا فقدان مهارت‌های متناسب. به هر صورت، پروژه‌های کلان داده ریسک‌های خاص خود را به همراه دارند. با توجه به فناوری پیشرفته‌ای که آنان نیاز دارند و تازگی نسبی مجموعه مهارت‌های مورد نیاز کار با اطلاعات، کارهای خاصی در هر قدم از این پروژه‌ها باید انجام شود تا اطمینان ایجاد کند که مشکلاتی پیش نخواهد آمد که منجر به اتلاف وقت، پول یا حتی مشکلات قانونی شود.تاجران و فعالان حوزه کسب و کار به پذیرفتن ریسک‌ عادت دارند، آنان ریسک‌ها را ارزیابی کرده و در مقابل آنها خود را تقویت می‌کنند، در غیر این صورت نمی‌توان برای مدت زیادی در آن کسب و کار باقی ماند. بنابراین دلیلی برای ترس از کلان داده‌ها وجود ندارد. البته همیشه باید از خطراتی که می‌توانند به‌طور بالقوه در صورتی که در بر طرف کردن اساسی آنها شکست بخوریم، رخ دهند آگاه باشیم. در ادامه به ۵ مورد از بزرگترین خطراتی که پروژه‌های کلان داده به همراه دارند، اشاره می‌کنیم. فهرستی که برای فعالان و استفاده‌کنندگان از این نوع کسب و کارها باید مورد توجه قرار گیرد.

امنیت اطلاعات

این ریسک مشخص است و اغلب نخستین موردی است که در ذهن افراد وجود دارد وقتی که به پشتیبانی اطلاعات جمع‌آوری شده و تحلیل آنها فکر می‌کنند. سرقت اطلاعات به شدت در حال افزایش است و جرائم مربوط به اطلاعات رشد کرده‌اند. آسیب‌های مربوط به این حوزه نیز بزرگتر و مخرب‌تر شده‌اند. در حقیقت ۵ مورد از ۶ مورد از مخرب‌ترین سرقت اطلاعات در طول تاریخ (eBay، JP Morgan Chase، Adobe، Target و Evernote) در دو سال اخیر صورت گرفته‌اند.هرچه اطلاعات شما بزرگتر باشد، هدف بزرگ‌تری برای مجرمان خواهد بود تا به وسیله ابزارهایی آن را سرقت کرده و بفروشند. در مورد شرکت تارگت، هکرها اطلاعات مربوط به کارت‌های اعتباری و بدهی ۴۰ میلیون مشتری را دزدیدند و علاوه بر آن اطلاعات شخصی مانند ای‌میل‌ها و آدرس‌های جغرافیایی نزدیک به ۱۱۰ میلیون نفر را ربودند. در ماه مارس، یک قاضی فدرال حکم داد که شرکت تارگت ۱۰ میلیون دلار در قالب یک توافق به کسانی که متضرر شده‌اند، بپردازد که سقف پرداخت برای هر فرد ۱۰ هزار دلار بود.

شخصی بودن اطلاعات

یکی از معضلات عمده مربوط به کلان داده‌ها امنیت مسائل شخصی است. با این حال، علاوه بر اطمینان داشتن از امنیت اطلاعات خصوصی افراد از دست مجرمان، باید اطمینان حاصل کرد که اطلاعات حساسی که ذخیره و جمع‌آوری می‌کنید از طرق مختلف و کمتر آسیب زننده فاش نمی‌شوند اما همچنین امکان سوء‌استفاده‌هایی از طرف کارفرما یا افرادی که از طرف وی روی اطلاعات کار می‌کنند و مسوول تحلیل و گزارش‌دهی اطلاعات هستند، وجود دارد. سرپیچی از قوانین حفاظت از اطلاعات می‌تواند منجر به این شود که دادخواهی‌های گران یا حتی زندان پیامد این گونه اتفاقات باشند، بسته به اینکه چه نوع اطلاعاتی مورد استفاده قرار گرفته و برخورد نظام قضایی چگونه باشد. سال گذشته، خدمات اینترنتی کرایه خودروی خصوصی اوبر، وقتی یکی از مدیرانش از نوعی خدمات برای ردیابی حرکت‌های یک روزنامه‌نگار استفاده کرد، دچار بحث‌های جدال‌برانگیزی شد.

هزینه‌ها

جمع‌آوری اطلاعات، جمع‌بندی آنها، ذخیره، تحلیل و گزارش‌دهی همگی هزینه‌بر هستند. بیش از این همه، هزینه‌های مربوط به شکایات نیز قرار دارند. این هزینه‌ها می‌توانند با بودجه‌بندی دقیق در طول مراحل برنامه‌ریزی کاهش پیدا کنند اما اشتباه در آن منجر به صرف هزینه‌های بیشتری می‌شود که به‌طور بالقوه ارزش افزوده ناشی از کار روی اطلاعات را می‌تواند از بین ببرد. به همین دلیل است که شروع کردن به این کسب و کار نیاز به استراتژی خاصی دارد. یک استراتژی خوب به وضوح موجب می‌شود که از مزایای آن بتوان بهره برد و بنابراین می توان از طریق تخصیص منابع به پروژه هزینه ها را متعادل کرد. برای مثال یکی از بانک‌ها در مورد هزینه‌های ذخیره کردن و نگهداری اطلاعات جمع‌آوری شده نگران بود و گمان می‌کرد اقدام به این کار در مورد تحلیل پروژه هزینه‌هایی دارد که ازمزایای بالقوه آن بیشتر خواهد بود. با تعیین و حذف اطلاعات غیرمرتبط از پروژه، بانک می‌توانست هزینه‌ها را تحت کنترل درآورده و بتواند به اهداف مورد نظر خود برسد.

تحلیل‌های ضعیف

گاهی اوقات نتیجه حاصل از این اطلاعات می‌تواند اشتباه باشد. تفسیر غلط الگوهای نشان داده شده توسط اطلاعات و ترسیم ارتباطات علّی و معلولی که در حقیقت ناشی از انطباق‌های تصادفی هستند، یکی از مشکلات موجود بر سر راه این حیطه است. اطلاعات مربوط به فروش ممکن است نشان دهنده افزایش در نتیجه یک رویداد بزرگ ورزشی باشند که موجب می‌شوند یک ارتباط علی بین هواداران ورزشی و محصولات یا خدمات ارائه شده ترسیم شود، در حالی که حقیقت این است که چنین افزایشی به دلیل وجود افراد بیشتر در شهر است و این افزایش در نتیجه برگزاری یک رویداد موسیقی زنده نیز به همان اندازه ایجاد خواهد شد. علاوه بر مواردی که گفته شد، مراقبت‌هایی باید صورت گیرد تا از جهت‌گیری اشتباه که به سادگی زمانی که تحلیلگر با یک پروژه با ذهنیت از پیش تعیین شده در مورد آنچه که به دنبال آن است می‌گردد، جلوگیری شود. تنها راه برای حفاظت در مقابل این امر اطمینان یافتن از این مطلب است که بهترین رویه‌ها در مورد چنین پروژه‌ای مورد استفاده قرار گیرند. پروژه روندهای گوگل، مثال خوبی از این دست ارائه می‌کند. این پروژه طراحی شده است تا طرح‌های دقیقی از آنچه در جست‌وجوهای کاربران گوگل انجام می‌شود، ارائه کند. در ابتدا این پروژه نتایج متقاعدکننده‌ای فراهم می‌کرد. اما با گذشت زمان، پیش‌بینی‌های آن به‌طور فزاینده‌ای از واقعیت فاصله گرفتند. به نظر می‌رسد که الگوریتم‌های پشت این پروژه آنقدر دقیق نیستند که ناهنجاری‌هایی خاصی را شناسایی کنند و به‌صورت گسترده‌ای قابلیت اعتبار آنها در طول زمان کاهش می‌یابد.

اطلاعات نامناسب

پروژه‌های زیادی در این حوزه انجام شده که در آن اطلاعات نامناسبی جمع‌آوری شده است. در برخی از موارد زمان استفاده از آن اطلاعات سپری شده و در برخی موارد دیگر اطلاعات بی‌ربط است. این امر بیشتر ناشی از زمان ناکافی است که صرف استراتژی‌های آن می‌شود. تب استفاده از کلان داده‌ها منجر به «جمع‌آوری همه چیز و فکر و تحلیل آن در آینده» در بسیاری از سازمان‌ها شده است. این امر نه‌تنها به هزینه در حال افزایش ذخیره اطلاعات و اطمینان بخشیدن به کاربران اضافه می‌کند، بلکه منجر به این می‌شود که مقادیر زیادی از اطلاعات به سرعت قدیمی شوند. خطر واقعی اینجا است که کسی درگیر یک رقابت در این حیطه شود. اگر به درستی اطلاعات مورد تحلیل قرار نگرفته باشند، بینش‌های درستی و باارزشی در پی نخواهد داشت این در حالی است که رقیبان دیگر به احتمال زیاد پروژه‌های خود را دنبال خواهند کرد و اگر به درک درستی دست پیدا کنند، در بازار پیشتاز خواهند شد.

این ۵ مورد تنها تعدادی از خطراتی بود که هر پروژه کلان داده باید پیش از آنکه به جمع‌آوری اطلاعات یا زیرساخت‌های مربوط به آن بپردازد به آنها توجه کند. کسب و کارها با هر اندازه‌ای و افراد عادی، باید به‌طور کامل با مزایا و معایب پروژه‌های کلان داده آشنا باشند. اگر آنها فاقد این آشنایی باشند، با خطراتی جدی مواجه می‌شوند. آنها علاوه بر اینکه باید از خطرات آگاه باشند، باید با چشمانی باز ورود احتمالی به پروژه‌های کلان داده را مورد بررسی قرار دهند.

5 مشکل و خطر استفاده از کلان داده‌ها