نگاهی متفاوت به دادهها
در دسته اول با عنوان «بدن بهمثابه داده» از کارگزاری که با اتکا به روشهای غیرمتعارف میتوانست با احتمال خیلی بالا شانس موفقیت اسبها را پیشبینی کند نمونه میآورند. درحالیکه دیگران بر تبار اسبها تاکید میکنند او از میان دادهها به همبستگی بطن چپ و طحال و شیوه گام برداشتن اسب به موفقیت او پی برده است! خیلی وقتها توضیح رابطه کشفشده به این شیوه مقدور نیست و بهزعم آنها واقعا اهمیتی هم ندارد. آنچه مهم است پیشبینی درست است نه توضیح آنها!
مثلا والمارت بهعنوان بزرگترین فروشگاه جهان دریافته است که وقتی توفان رخ میدهد تقاضای مردم برای تارت توتفرنگی به طرز قابلتوجهی بالا میرود! چرا؟ چه اهمیتی دارد! این مهم است که سرعت فروش این کالا در این زمان هفت برابر میشود.
در بخش بعدی به «کلمات بهمثابه داده» میپردازند. آنها متخصصان داده فیسبوک را که ادعا میکنند میتوانند روزانه شادی ناخالص ملی هر کشور را محاسبه کنند، به چالش میکشند، زیرا معتقدند که آدمها در شبکههای اجتماعی بابت میزان شادی زندگی اجتماعیشان دروغ میگویند. آنها براساس تحقیقات انجامشده باور ژورنالیستی معروفی که میگوید «اگر خون دارد برد دارد» به استناد یک پژوهش عملی در یک وبسایت معروف را زیر سوال میبرند و نشان میدهند که برخلاف باور معمول، احتمال جنجالی و فراگیر شدن یک مقاله مثبت بهمراتب بیشتر است!
در همین بخش آنها براساس گرایش اعضای کنگره کلمات را کدگذاری کردند و بر همین اساس روزنامههای دموکرات و جمهوریخواه را در سراسر ایالاتمتحده طبقهبندی کردند. در مرحله بعد با تطبیق گرایش مخاطبان در ایالات مختلف با روزنامههای محلی نتیجه میگیرند که گرایش روزنامهها بیش از آنکه متاثر از مالکان آنها باشد متاثر از مخاطبان آنها است.
در بخش پایانی به «تصویر بهمثابه داده» میپردازند. برای مثال با خلق «چهره متوسط» از اسکن تصاویر هزار سالنامه دبیرستانی توانستند تصاویر دختران و پسران دهههای مختلف را با یکدیگر مقایسه کنند. در نگاه اول به نظر میرسد که دهه به دهه چهرهها خندانتر شدهاند، اما دلیل این تغییر، مارکتینگ برندهایی مانند کداک برای ایجاد تداعی میان عکس و خوشحالی است. در مثال دیگر بهجای اندازهگیری رشد اقتصادی کشورها از آمارها به پیشبینی آنها براساس نور شهرها و کشورها از تصاویر ماهوارهای میپردازند.
از محتوا و نمونه تحلیلهای ارائهشده آنها که بگذریم آنچه اهمیت دارد این است در عصر دیجیتال تعبیر ما از آنچه داده مینامیم بازتعریف شده است و دانش فراوانی در این اطلاعات جدید نهفته است. سرنوشت شرکتهایی مانند «پرمیس» که میلیونها دلار از محل فروش تحلیل دادهها از تصاویر به بانکها و صندوقهای پوشش ریسک به دست میآورند موید ارزش و اقتصاد نگاه جدیدی است که فراتر از نگاه مرسوم به داده و حتی ابرداده است. اینجاست که نگرانی ما از آمارهایی که قرار نیست واقعیت را بگویند میتواند کم و کمتر شود و ارزش و اهمیت این شیوه تحلیل میتواند موردتوجه تحلیلگران و علاقهمندان داده قرار گیرد.