در دسته‌  اول با عنوان «بدن به‌مثابه داده» از کارگزاری که با اتکا به روش‌های غیرمتعارف می‌توانست با احتمال خیلی بالا شانس موفقیت اسب‌ها را پیش‌بینی کند نمونه می‌آورند. درحالی‌که دیگران بر تبار اسب‌ها تاکید می‌کنند او از میان داده‌ها به همبستگی‌ بطن چپ و طحال و شیوه گام برداشتن اسب به موفقیت او پی برده است! خیلی وقت‌ها توضیح رابطه کشف‌شده به این شیوه مقدور نیست و به‌زعم آنها واقعا اهمیتی هم ندارد. آنچه مهم است پیش‌بینی درست است نه توضیح آنها!

مثلا والمارت به‌عنوان بزرگ‌ترین فروشگاه جهان دریافته است که وقتی توفان رخ می‌دهد تقاضای مردم برای تارت توت‌فرنگی به طرز قابل‌توجهی بالا می‌رود! چرا؟ چه اهمیتی دارد! این مهم است که سرعت فروش این کالا در این زمان هفت برابر می‌شود.

در بخش بعدی به «کلمات به‌مثابه داده» می‌پردازند. آنها متخصصان داده فیس‌بوک را که ادعا می‌کنند می‌توانند روزانه شادی ناخالص ملی هر کشور را محاسبه کنند، به چالش می‌کشند، زیرا معتقدند که آدم‌ها در شبکه‌های اجتماعی بابت میزان شادی زندگی اجتماعی‌شان دروغ می‌گویند. آنها براساس تحقیقات انجام‌شده باور ژورنالیستی معروفی که می‌گوید «اگر خون دارد برد دارد» به استناد یک پژوهش عملی در یک وب‌سایت معروف را زیر سوال می‌برند و نشان می‌دهند که برخلاف باور معمول، احتمال جنجالی و فراگیر شدن یک مقاله مثبت به‌مراتب بیشتر است!

در همین بخش آنها براساس گرایش اعضای کنگره کلمات را کدگذاری کردند و بر همین اساس روزنامه‌های دموکرات و جمهوری‌خواه را در سراسر ایالات‌متحده طبقه‌بندی کردند. در مرحله بعد با تطبیق گرایش مخاطبان در ایالات مختلف با روزنامه‌های محلی نتیجه می‌گیرند که گرایش روزنامه‌ها بیش از آنکه متاثر از مالکان آنها باشد متاثر از مخاطبان آنها است.

در بخش پایانی به «تصویر به‌مثابه داده» می‌پردازند. برای مثال با خلق «چهره متوسط» از اسکن تصاویر هزار سالنامه دبیرستانی توانستند تصاویر دختران و پسران دهه‌‌های مختلف را با یکدیگر مقایسه کنند. در نگاه اول به نظر می‌رسد که دهه به دهه چهره‌ها خندان‌تر شده‌اند، اما دلیل این تغییر، مارکتینگ برندهایی مانند کداک برای ایجاد تداعی میان عکس و خوشحالی است. در مثال دیگر به‌جای اندازه‌گیری رشد اقتصادی کشورها از آمارها به پیش‌بینی آنها براساس نور شهرها و کشورها از تصاویر ماهواره‌ای می‌پردازند.

از محتوا و نمونه تحلیل‌های ارائه‌شده آنها که بگذریم آنچه اهمیت دارد این است در عصر دیجیتال تعبیر ما از آنچه داده می‌نامیم بازتعریف شده است و دانش فراوانی در این اطلاعات جدید نهفته است. سرنوشت شرکت‌هایی مانند «پرمیس» که میلیون‌ها دلار از محل فروش تحلیل داده‌ها از تصاویر به بانک‌ها و صندوق‌های پوشش ریسک به دست می‌آورند موید ارزش و اقتصاد نگاه جدیدی است که فراتر از نگاه مرسوم به داده و حتی ابرداده است. اینجاست که نگرانی ما از آمارهایی که قرار نیست واقعیت را بگویند می‌تواند کم و کمتر شود و ارزش و اهمیت این شیوه‌ تحلیل می‌تواند موردتوجه تحلیلگران و علاقه‌مندان داده قرار گیرد.

 

این مطلب برایم مفید است
2 نفر این پست را پسندیده اند