کار با داده‌های اقتصادی و علم آمار

مترجم: جعفر خیرخواهان

با اینکه در بخش‌های پیشین، بر پایه شواهد تجربی بحث کردیم، عمده تمرکز ما به استدلال قیاسی معطوف شده بود، اما بیشتر استدلال‌های بی‌پایه و اساسی که در علم اقتصاد برخورد می‌کنیم از نوع قیاسی نبوده، بلکه ادعاهایی درباره «واقعیات» هستند، یعنی داده‌ها چه چیزهایی نشان می‌دهند؛ بنابراین در بخش‌های بعدی می‌خواهیم نکاتی را گوشزد کنیم تا خود را در برابر چنین ادعاهایی حفاظت نماییم. با خواندن مطالب این بخش‌ها همچنین درک بهتری پیدا می‌کنید که اقتصاد به چه چیزهایی می‌پردازد. از آنجا که اقتصاد علمی تجربی است، اقتصاددان‌ها بیشتر وقت خویش را صرف اندازه‌گیری میزان اثرات پیش‌بینی شده و همچنین آزمون تئوری‌ها در برخورد با مشاهدات می‌کنند. در نظرسنجی اخیری که از اقتصاددانان آمریکایی جوان شاغل در ده دپارتمان برتر اقتصاد انجام شد حدود نصف آنها عمدتا کار تجربی و تقریبا یک سوم آنها ترکیبی از کار تئوریک و تجربی می‌کردند. این ایده که علم اقتصاد «صرفا یک مشت تئوری» است، قضاوتی نابجا است که از نگاه به دروس اقتصاد مقدماتی به دست آمده است چون که آنها بر زنجیره‌های استدلال قیاسی متمرکز شده‌اند.

۱- نقش بررسی‌های تجربی در علم اقتصاد

یک دلیل اینکه چرا کارهای تجربی در اقتصاد خیلی مهم است به این خاطر است که همه آنچه تئوری اقتصادی به ما می‌دهد معمولا جنبه کیفی و نه نتایج کمی دارد. تئوری اقتصادی در حالی‌که می‌تواند به ما بگوید اگر x اتفاق بیفتد، قیمت‌ها بالا خواهد رفت و اگر y اتفاق بیفتد، تولید کاهش خواهد یافت و از این قبیل، اما نمی‌تواند بگوید میزان این تغییرات چقدر است. در عین‌حال اغلب همین پرسش «چقدر» است که اهمیت دارد. اگر تئوری به ما می‌گوید افزایش نرخ بهره، بیکاری را «موقتا» افزایش خواهد داد، اطلاعات کافی به ما نمی‌دهد که تصمیم بگیریم آیا با افزایش نرخ بهره موافقت یا مخالفت کنیم. بیشتر مردم می‌خواهند بدانند بیکاری چقدر و چه مدت افزایش خواهد یافت و تنها شواهد تجربی است که توانایی حل این مساله را دارد.

دلیل دیگری که چرا بر کار تجربی تاکید می‌کنیم این است که کار تجربی صرفا خدمتکاری ساده نیست که جزئیات کشف نشده و باقی گذاشته تئوری شاهانه را روشن می‌کند. کار تجربی، ارباب یا قاضی نیز هست، یک نوع داوری که ورود برخی تئوری‌ها به درون حوزه مجاز را خوشامد می‌گوید و سایر تئوری‌ها را به جهان مادون مردودی‌ها می‌فرستد؛ بنابراین کنار گذاشته می‌شوند. (قطعا آنچه گفتیم حالتی آرمانی را توصیف می‌کند؛ برخی تئوری‌ها در عین حال که ضرباتی از شواهد رد شده می‌خورند بی‌دغدغه به حیات خود ادامه می‌دهند، اما نه برای همیشه.)

تمام کاری که استنتاج‌ها می‌کنند باز کردن دلالت‌هایی است که در فروض مدل وجود دارد. اگر اقتصاددانان قواعد منطقی را به درستی به کار ببرند، پس نتیجه‌گیری‌های آنها نیز درست است، اما درباره فروض چه می‌گوییم؟ آنچه اهمیت دارد درستی یک فرض به معنای مطلق آن نیست، بلکه فقط کافی است برای مقصود مد نظر ما تا حد کفایت درست و دقیق باشد. محرز شدن آن هم زمانی میسر است که تئوری ساخته شده با آن فروض، با شواهد تجربی سازگار باشد.

۲- انواع شواهد تجربی

چندین نوع شواهد تجربی وجود دارد که برای برآورد میزان اثر متغیر و آزمون تئوری‌ها استفاده می‌شوند.

حکایت‌ها

همه ما با شیوه گزارش‌گیری رسانه‌ها و گفت‌وگوها و مصاحبه‌های خبری هر روزه آنها به شکل حکایت و سرگذشت آشنا هستیم. شیوه‌ای که با آب و تاب همراه بوده و سرگرم‌کننده است و به ذهن شنونده فشار نمی‌آورد و می‌توان از آن برای «اثبات کردن» دقیقا هر چیزی استفاده کرد. هلن سنگدل با ارائه مدرک نشان می‌دهد که گیرندگان کمک‌های رفاهی یک مشت آدم علاف هستند چون او کسی را می‌شناسد که شغل خود را ترک کرد تا کمک‌های رفاهی دریافت کند و سارای دل‌نازک واکنش نشان می‌دهد که او شخصی را می‌شناسد که دنبال شغل می‌گردد، اما نمی‌تواند پیدا کند و اگر کمک‌های رفاهی نبود از گرسنگی مرده بود. آنچه هر دوی آنها می‌گویند درست است، اما در شیوه برخورد با مساله که گویی فقط گفته آنها درست است اشتباه می‌کنند. آنچه آنها زور می‌زنند بگویند این است که دست کم یک شخص در فهرست کمک‌های رفاهی، علاف و هرزه‌گرد است و دست‌کم یک نفر که واقعا مستحق کمک است داریم. چه کسی این را منکر شده است؟ استدلال کردن فقط از یک مورد، توان خسارت‌زایی زیادی دارد و این تنها به علم اقتصاد محدود نمی‌شود. اینکه صلح و سازش چمبرلین با هیتلر در انتهای دهه ۱۹۳۰ اشتباه بود به این معنا نیست که همه کوشش‌ها برای جلوگیری از وقوع جنگ اشتباه است.

رویدادهای برجسته

رویداد برجسته ارتباط نزدیکی با حکایت‌ها پیدا می‌کند. آن هم شبیه بسیاری حکایت‌ها، متکی بر یک مورد است، اما موردی که یک رویداد به چشم‌آمدنی (برای مثال بحران بزرگ دهه ۱۹۳۰)است. رویداد برجسته دو برتری نسبت به حکایت معمولی دارد. نخست هر تئوری که سعی در تبیین یک دسته معین رویدادها دارد، اگر قادر به تبیین رویدادی برجسته که در آن دسته جای می‌گیرد نباشد شکست تماشایی می‌خورد. دوم اگر چه اصولا یک رویداد برجسته لزوما علت برجسته‌ای ندارد (بیشتر اوقات سقوط بهمن از یک گلوله کوچک برفی شروع می‌شود،) در بیشتر موارد عامل اصلی یک رویداد برجسته، چیزی است که از درون داده‌های ما فریاد می‌زند و نه چیزی که به آرامی در گوشمان زمزمه می‌شود و با توجه به سر و صدای پیش‌زمینه اصلا شنیده نمی‌شود؛ بنابراین اگر چه رویداد برجسته را اغلب برحسب اعداد یعنی علم آمار توصیف می‌کنند، آن غالبا پیام خویش را بدون کمک گرفتن از فنون پیچیده آماری به ما می‌رساند.

پس در حالی‌که گزارش‌ها درباره رویدادهای برجسته واقعا حکایت‌گونه هستند، آنها دست‌کم در سطح آموزشی، چیزهای بیشتری از حکایت معمولی برای یاد دادن به ما دارند و می‌توان این دفاع جانانه را از آنها کرد که وقتی رخ می‌دهند اقتصاددانان قویا و شاید بیش از حد تحت‌تاثیر آنها قرار می‌گیرند، اما مشکل در «وقتی که رخ می‌دهند» است. بر اساس تعریف، آنها رویدادهایی نادر هستند؛ بنابراین اقتصاددانان باید معمولا به دنبال چیز دیگری بگردند.

علم آمار

همانطور که یک ضرب‌المثل می‌گوید: «حکایت»، اسم مفرد برای «داده‌ها» است. اگر هلن سنگدل فقط یک مورد از کلاهبرداری در کمک‌های رفاهی نیاورده بود، بلکه هزار مورد می‌آورد و اگر این هزار مورد یک نمونه فراگیر بود، پس او استدلالی قوی داشته است. برای تعمیم‌های معتبر، باید به دنبال موردهای زیادی بگردیم و اصولا در حالی‌که می‌توان هر کدام از موارد را خیلی سریع یکی پس از دیگری خواند، چنین کاری نه فقط به شدت زمانبر بوده، بلکه از حافظه شنونده و قطعا شکیبایی وی بیرون است. پس نیازمند خلاصه کردن این موردها به هر طریقی هستیم. برخی اوقات می‌توان این کار را بدون توسل به اعداد کرد، یعنی مثلا می‌گوییم «مردم میل به زندگی در محیط خانوادگی دارند.» اما اگر بخواهیم دقیق‌تر حرف بزنیم نیاز به کمی کردن است؛ برای مثال با ذکر درصدی از مردم که در محیط خانوادگی زندگی می‌کنند؛ یعنی از علم آمار استفاده می‌کنیم.

اینکه با کمک علم آمار می‌توان داده‌ها را به شکل فشرده توصیف کرد استفاده مهمی از این علم بوده، اما تنها مورد استفاده نیست. استفاده دیگر، کندوکاو و عمیق شدن در آن چیزی که به آسانی قابل‌مشاهده ‌باشد و استنتاج روابط زیربنایی است. برای مثال اینکه آیا تفاوت درآمد بین یک نمونه از نیویورکی‌ها و یک نمونه از شیکاگویی‌ها احتمالا فقط به علت ویژگی‌های نمونه‌ها یا تفاوت‌های واقعی درآمدها بوده است و اینکه آیا تغییرات یک متغیر، مثلا کسری بودجه دولت، باعث تغییر در متغیری دیگر مثلا GDP می‌شود. هدف این کتاب آموزش دادن به شما درباره چگونگی یافتن و رد کردن استدلال‌های نادرست است. به این جهت با انواع روش‌هایی آشنا می‌شنویم که می‌توان از علم آمار برای دزدیدن عقل ما استفاده کرد. شاید این باعث شود نتیجه بگیرید پس اصلا ارزش ندارد که خود را به زحمت انداخته و علم آمار را یاد بگیریم، اما این تفکر اشتباه است. تهیه فهرست نسبتا جامع از همه حوادثی که هنگام رفتن به خرید ممکن است برایتان اتفاق بیفتد از سر خوردن هنگام سوار شدن به خودرو تا افتادن مواد غذایی روی انگشت پایتان نیز شاید چنین به نظر آید که در خانه ماندن و از گرسنگی مردن برایمان بهتر است.

هنگام توضیح در این ‌باره که چگونه آمار را بخوانیم و ارزیابی کنیم ابتدا باید با سه طرز تلقی منفی مبارزه کرد. یکی این تلقی که علم آمار، یک نوع سندیت و اصالت «علمی» فراهم می‌کند: پیش کشیدن آماری که از نظر شما حمایت می‌کند روش قاطعی برای پایان بخشیدن به یک استدلال است. این حرف چرتی است. «نگاه به داده‌ها» اغلب نخستین گام در یک تحلیل جدی است. برخی اوقات نیاز است بپرسیم چگونه داده‌ها جمع‌آوری شده‌اند، تعاریف مورد استفاده چقدر مرتبط با آن‌ چیزی هستند که ما می‌خواهیم اندازه بگیریم، داده‌های رقیب چه چیزی نشان می‌دهند و غیر آن. تلقی دوم این است که تمام آمارها غیرقابل اعتماد بوده و باید نادیده گرفته شوند و در حالی‌که اعداد دروغ نمی‌گویند دروغگویان عددسازی می‌کنند، اما این نیز حرف بی‌منطقی است. اگر از آمار با ژرف‌اندیشی استفاده شود شاهراهی به حقیقت به روی ما می‌گشاید. واکنش درست به وجود آمارهای دروغ و غیرقابل اتکا این است که خواننده شکاک و نه بدبین و بی‌تفاوت باشیم؛ یعنی با اطلاعات عددی دقیقا مثل اطلاعات کاملا زبانی برخورد کنیم. سومین تلقی از آمار این باور است که وقتی با آمار مواجه می‌شوید امکان درک آنچه اتفاق می‌افتد نیست مگر اینکه سواد ریاضی بالایی داشته باشید، اما در اینجا هیچ دانش ریاضیات بیش از سطح دبستان نیاز نیست؛ بنابراین محتوای این بخش بسیار شبیه به منطق شفاهی است که هر روز به کار می‌بریم.

۳- هنگام نگاه به آمارها، حواسمان

به چه جاهایی باشد

پیش از اینکه به سنجه‌های معین آماری و امکان بهره‌برداری نادرست از آنها بپردازیم، لازم است به برخی دلایل احتیاط و حواس جمعی درباره آمار نگاهی بیندازیم.

محدودسازی دامنه تمرکز

فشرده‌سازی اطلاعات که با علم آمار ممکن می‌شود فایده زیادی داشته، اما یک مانع جدی نیز هست. علم آمار با پرتوافکنی قدرتمند بر یک جنبه معین از وضعیت، ما را ترغیب به نادیده گرفتن سایر جنبه‌های آن وضعیت می‌کند و در نتیجه آنچه را می‌توانست تفاوت‌های مهم بین مشاهدات مختلف ما باشد کمرنگ می‌سازد. برای آماردانی که خواهان اندازه‌گیری وزن مردم است، یک مرد بانکدار ۲۵ ساله ساکن نیویورک و یک زن بدبخت ۶۰ ساله ساکن هائیتی که وزن هر دو ۷۰ کیلوگرم است یکسان هستند. تنها چیزی از مردم که برای او اهمیت دارد وزن آنها است. این را با کار یک روزنامه‌نگار مقایسه کنید که با

۵ عراقی مصاحبه می‌کند و نتیجه را چنان گزارش می‌کند که گویی نشانه افکار عمومی عراقی‌ها است. آماردان می‌گوید چنین تعمیمی بی‌معنی است و نمونه وی بسیار اندک بوده و نماینده جامعه عراقی نیست چون که این پنج نفر احتمالا به این دلیل انتخاب شده‌اند که مایل به صحبت با یک گزارشگر آمریکایی بوده‌اند و نیز شاید به این دلیل که می‌توانستند انگلیسی صحبت کنند. آماردان می‌گوید برای شناخت افکار عمومی جامعه عراق، یک نظرسنجی آماری با نمونه کافی و تصادفی انتخاب شده انجام دهید. گزارشگر شاید در جواب بگوید اگر چه گزارش از نظر آماری ایراد داشته، اما حکم یک نظرسنجی آماری را دارد چون به مردم اجازه داده است هر چه می‌خواهند بگویند و درک گوناگونی به دست می‌آید که با نگاه به اعداد اصلا به دست نمی‌آید. آرتور کستلر (نویسنده رمان مهم سیاسی «تاریکی در نیمروز») زمانی گفته بود: «آمار چیزی بیرون نمی‌دهد، این جزئیات است که اهمیت دارد.» و آنچه آماردان‌ها هنگام ارائه میانگین‌ها می‌شویند و کنار می‌گذارند گاهی اوقات بسیار مهم است. مثل این می‌ماند که یک وکیل مدافع در مراسم بازنشستگی خود چنین بگوید: من برخی مشتریان خود را که می‌دانستم گناهکار هستند از مجازات رهانیدم، در حالی‌که عده‌ای دیگر از مشتریان که می‌دانستم بیگناه هستند محکوم شدند. خوب میانگین که بگیریم عدالت اجرا شده است.»

به‌علاوه از آنجا که اندازه‌گیری بسیار مهم است بسیار وسوسه می‌شویم که باور کنیم هر چیزی قابل اندازه‌گیری نباشد پس مهم نیست یا دست‌کم اینکه تاکید زیادی روی آن نکنیم. برای مثال اقتصاددانان هنگام تبیین نسبت پس‌انداز، یعنی درصدی از درآمد خانوار که پس‌انداز می‌شود، به آسانی قادر به اندازه‌گیری چندین متغیر توضیحی مثل اندازه خانوار، درآمد و ثروت آن هستند. آنچه که آنها معمولا نمی‌توانند اندازه‌گیری کنند آینده‌نگری و دوراندیشی است. پس آنها معمولا فرض می‌کنند که این عامل در بین همه خانواده‌ها یکسان باشد؛ بنابراین هنگام تبیین تفاوت نرخ پس‌انداز انواع خانواده‌ها، نادیده گرفته می‌شود. برخی اوقات وقتی این کار را می‌کنید و یک عامل را نادیده می‌گیرید چون توانایی اندازه‌گیری آن را ندارید، داده‌ها حسابی شما را گوشمالی می‌کنند: تنها توانایی تبیین بخش اندکی از نوساناتی را پیدا می‌کنید که سعی در تبیین دارید، اما فرض کنید آن‌طور که احتمالا به نظر می‌رسد، آینده‌نگری با ثروت همبستگی مثبت داشته باشد. پس تحلیل شما برازش خوبی با داده‌ها پیدا می‌کند، اما اهمیت ثروت را زیاده برآورد می‌کند چون که ثروت تا حدودی به جای آینده‌نگری آمده است و نیز اهمیت تفاوت‌هایی در آینده‌نگری را به کلی از دست داده‌اید.

داده‌هایی که به من داده شده است

تولید داده‌های خام آماری از نظرسنجی‌ها، اغلب فوق‌العاده پرهزینه است و نیز آنهایی را که زحمت پاسخ دادن به خود نمی‌دهند حذف می‌کند. از آنجا که دولت جیب‌های بزرگی دارد و می‌تواند مردم را وادار به پاسخ دادن کند، اقتصاددانان عمدتا متکی به آمار تولیدی دولت هستند، اما دولت این داده‌ها را تولید نمی‌کند تا اقتصاددانان آکادمیک را خوشحال سازد بلکه برای استفاده خود است. برخی اوقات آنچه دولت اندازه‌گیری می‌کند ارتباط نسبتا نزدیک با آنچه اقتصاددانان مایل به اندازه‌گیری هستند دارد؛ اما در سایر زمان‌ها، سنجه‌های دولت، پیوند ضعیف با متغیرهای مورد استفاده در تئوری اقتصادی دارد به طوری که استفاده از این داده‌ها برای آزمون تئوری برخی اوقات کار پرزحمتی است. زمان‌هایی هست که اگر داده‌ها با تئوری نمی‌خواند، معقول‌تر است که داده‌ها را نامناسب تشخیص دهیم تا اینکه بخواهیم تئوری را دور بیندازیم.

خطاها در داده‌ها

مشکل مهم دیگر به کیفیت داده‌های ما مربوط می‌شود. در حالی‌که برخی داده‌ها از قبیل داده‌های قیمت سهام و نرخ ارز عالی هستند بیشتر داده‌ها به درجات متفاوت ضعف دارند. یک دلیل بدیهی ضعف داده‌ها به هزینه بالای جمع‌آوری آنها مربوط است و اگر چه داده‌های غیرقابل اعتماد منجر به تصمیمات سیاستگذاری زیان‌بار می‌شود، پیشنهاد هزینه بیشتر کردن در آمار اقتصادی روش مطمئن تهییج و برانگیختن رای‌دهندگان نیست. دلیل دیگر این است که عده‌ای از مردم میلی به ارائه داده‌های مورد نیاز ندارند یا اینکه آنها را منکر می‌شوند؛ بنابراین عده‌ای از مردم در جایی کار می‌کنند که «اقتصاد زیرزمینی» نامیده می‌شود، یعنی میزان درآمد و اشتغال خود را به اداره مالیات و سایر ارگان‌های دولتی گزارش نمی‌دهند. اندازه‌گیری این میزان از GDP که کمتر گزارش می‌شود دشوار است و برآوردهای موجود بسیار متفاوت است اما برای اقتصاد آمریکا چیزی حدود ۱۰ درصد GDP رقم نامعقولی نیست. در بیشتر کشورها به خصوص کشورهای کمتر توسعه یافته، این رقم بسیار بیشتر است.

دلیل سوم که نامحسوس‌تر است شکاف بین آنچه ما دوست داریم داده‌هایمان اندازه‌ بگیرند و آنچه آنها واقعا اندازه‌گیری می‌کنند هست. برای مثال اصولا کاری که مردم برای پخت غذا و سایر کارهای خانه می‌کنند یک نوع تولید محصول و دقیقا شبیه کاری است که آنها در کارخانه‌ها و ادارات می‌کنند، اما ما فاقد داده‌های کافی درباره کار منزل هستیم؛ به طوری که آن را در GDP شامل نمی‌کنیم. این تنها یکی از چندین تفاوت بین آن چیزی است که ما دوست داریم در GDP شامل کنیم و آنچه قادر به شامل کردن هستیم. بسیاری از مجموعه داده‌ها نیز مشکلات خاص خود را دارند: مثل شاخص‌های قیمت، اندازه‌گیری اشتغال و نرخ فقر.

چهارم اینکه داده‌های استخراج شده به صورت پسماندهای کوچک از تفاوت بین اعداد بزرگ و به صورت درصد بیان کردن آنها، مثلا نرخ پس‌انداز، مستعد ایجاد خطاهای بزرگی هستند.

پس خطاهای محاسباتی و نسخه‌برداری وجود دارد. در دوره‌ای آنها تعداد زیادی از مقالات در نشریات علمی اقتصادی را آلوده کردند و شاید هنوز هم می‌کنند، در حالی‌که در بیشتر موارد نتایج کلی یک مقاله را تغییر نمی‌دهند در مواردی این کار را می‌کنند. وقتی با حجم انبوه داده‌ها سروکار داریم، نسخه‌برداری از خطاها، از قبیل جابه‌جا شدن ارقام احتمالا رخ می‌دهد. (من دو بار خطاهای جدی در یک پایگاه داده‌های همگانی یافتم.) در کارهای خودم برخی خطاها یافته‌ام که با کنترل دقیق هم هنوز پابرجا بودند. کاربرد رایانه این مشکل را از بین نبرده است. (به‌علاوه اگر اشتباهی مثل ضرب کردن هنگامی که باید تقسیم کنید مرتکب گردید، وقتی محاسبات پرزحمت را با ماشین حساب اداری می‌کنید احتمال بیشتری هست متوجه خطای خود در مراحل بعدی شوید نسبت به کار با برنامه کامپیوتری که با یک فشار انگشت به برنامه می‌گوید ضرب را انجام دهد.) به‌علاوه حتی اگر داده‌ها به درستی وارد شده باشند، برنامه‌های کامپیوتری متفاوت برای محاسبات پیچیده، نتایج بسیار متفاوتی بیرون می‌دهند که در نهایت یکی از اینها درست است.

دقت و خطاها

تحت‌تاثیر دقت ظاهری آمارهای اقتصادی قرار نگیرید. در بیشتر موارد وانمود می‌شود که دقیق هستند. برای مثال گزارش اقتصادی به رییس‌جمهور در سال ۲۰۰۸ نشان می‌دهد که GDP در سال ۲۰۰۷ رقم ۵/۱۳،۹۷۰ میلیارد دلار است. ما خودمان را خوشبخت می‌دانیم اگر سومین عدد این رقم به اندازه ۱ واحد هم بالا رود.

برآورهای مقدماتی در معرض بازنگری‌های زیاد بوده؛ بنابراین شایسته توجه بالایی نیستند. نخستین برآورد از رشد دستمزد ساعتی کارکنان در فصل دوم سال ۱۹۶۶ با نرخ ۶/۶ درصد رشد کرده بود. نخستین بازنگری، این برآورد را به ۲/۱- درصد پایین آورد. اقتصاددانان این را می‌دانند و گول چنین ادعاهای ساختگی درباره دقت داده‌ها را نمی‌خورند، اما سایرین این‌طور نیستند.

مشکلات ترکیب کردن داده‌ها

در فصل سوم سال ۲۰۰۶ میانه قیمت یک خانه در آمریکا ۷/۱ درصد سقوط کرد. در عین‌حال، داده‌ها نشان می‌داد که در تمام چهار منطقه کشور قیمت میانه خانه افزایش یافت: به میزان ۳/۱۹ درصد در شمال شرق، ۴ درصد در غرب میانه، ۷/۰ درصد در جنوب و ۶/۱ درصد در غرب. چگونه امکان دارد چنین اتفاقی افتاده باشد؟ پاسخ این است که ترکیب منطقه‌ای؛ بنابراین وزن‌های مناطق مختلف در میانگین ملی تغییر کرد. تعداد خانه فروخته شده در جنوب از ۴۹ درصد کل خانه‌های کشور در فصل قبلی به ۵۵ درصد در فصل سوم ۲۰۰۶ تغییر کرد. از آنجا که میانه قیمت خانه در جنوب ارزان‌تر است، وزن بزرگ‌تر خانه‌های جنوب در میانگین، میانگین ملی را پایین کشید. یک مثال دیگر می‌آوریم. یک دانشگاه متهم به تبعیض جنسیتی در پذیرش دانشجویان تحصیلات تکمیلی شد؛ چون نسبت کمتری از درخواست‌کنندگان مونث را پذیرفته بود. از آنجا که پذیرش این دانشجویان در سطح دپارتمان انجام می‌شود، دانشگاه همه دپارتمان‌ها را کنترل کرد و هیچ تبعیضی مشاهده نشد، اما دپارتمان‌هایی که بیشترین نسبت درخواست‌کنندگان مونث را داشتند نسبت کوچک‌تری از هر دو درخواست‌کننده مونث و مذکر نسبت به سایر دپارتمان‌ها پذیرفته بودند. دلیل آوردن از آنچه برای کل اتفاق افتاده است به آنچه در واقع برای اجزای آن اتفاق می‌افتد خطرناک است. اگر مجبورید تحقیق کنید چرا چیزی بالا می‌رود یا پایین می‌آید، بهتر است ابتدا نگاه کنید چه اتفاقی برای هر کدام از اجزا می‌افتد.

تعهد علمی و داده کاوی

مشکل دیگر، تعهد علمی افراطی است. اقتصاددانی که چندین بررسی درباره یک قضیه بحث‌انگیز انجام داده است، احتمالا در کار بعدی خود به پاسخی مشابه آنچه در کارهای پیشین خود انجام داد می‌رسد. همه ما انگیزه قوی داریم تا ببینیم داده‌های جدید ما، آنچه را کارهای پیشین ما نشان داده است تایید کند یا دست‌کم رد ننماید. این برای احساس از خود راضی بودن فرد خوب است- چه کسی می‌خواهد اشتباه را بپذیرد؟ برای کار و حرفه شخص نیز خوب است. در محیط دانشگاهی، مثل هر جای دیگر، مدیریت معمولا نیازمند پیروی از یک مسیر سازگار است. به علاوه چه‌کسی می‌خواهد متحدان فکری خود را ناامید سازد؟ دلیل دیگر که فکر می‌کنم اهمیت کمتری دارد این است که ما می‌خواهیم نتایج پژوهش ما با باورهای سیاسی و ایدئولوژیک ما سازگاری داشته باشد.

تعهد علمی لزوما دلالت بر بی‌صداقتی ندارد. ما نه فقط آنچه را می‌بینیم باور می‌کنیم، بلکه آنچه را باور می‌کنیم نیز می‌بینیم. یک مثال ساده اینجا آورده‌ام. فرض کنید من آزمون آماری انجام می‌دهم و نتیجه‌ای کاملا خلاف آن چیزی که انتظارم دارم به دست می‌آورم. نخستین واکنشم این است که باید یک خطا در وارد کردن داده‌ها مرتکب شده باشم. پس کار را نگاه کرده و می‌بینم واقعا همین اتفاق افتاده است. اینکه عالی است. اگر نتایجی را منتشر کنیم که به علت خطا در وارد کردن داده‌ها به دست آمده است رفتار غیرمسوولانه‌ای است، اما فرض کنید من خطای وارد کردن داده‌ها مرتکب شده‌ام که فرضیه من را پشتیبانی می‌کند. پس من دوباره کارم را بازبینی نخواهم کرد. چنین برخورد متفاوتی در حالی‌که معقول است نتایج آماری من را به نفع فرضیه‌ام سوگیری می‌کند.

همانطور که می‌دانید واژه «سوگیری» اغلب معنای متفاوتی در اقتصاد و آمار نسبت به زندگی معمولی دارد. لزوما یا حتی معمولا دلالت بر بی‌صداقتی و حمایت ویژه ندارد بلکه معمولا به یک مساله اجتناب‌ناپذیر اشاره دارد. سوگیری‌ها نشانه کوتاهی اخلاقی پژوهشگر است فقط اگر قابل‌اجتناب‌ باشد یا اگر پژوهشگر یک سوگیری چاره‌ناپذیر را از دید خواننده پنهان کند یا اگر نتایجی را که از «طرف دیگر» بحث پشتیبانی می‌کنند پنهان کند.

نسخه پیچیده‌تر- و مبهم- دور ریختن آزمون‌هایی که فرضیه را رد می‌کنند به شرح زیر است: فرض می‌کنیم شما معتقدید تغییر نرخ رشد پول علت اصلی تبیین‌کننده نرخ تورم است. به داده‌های نرخ رشد پول و نرخ تورم نگاه می‌کنید و متاسفانه داده‌ها از فرضیه شما پشتیبانی نمی‌کنند. چکار می‌توانید بکنید؟ خوب شاید از خودتان بپرسید که آیا احتمال ندارد دوره زمانی کافی برای تغییرات نرخ رشد پول در نظر نگرفتید تا اثر خود را بر جای بگذارد. پس تحلیل خود را دوباره انجام می‌دهید این دفعه وقفه زمانی طولانی‌تری در نظر می‌گیرید. اگر نتیجه گرفتید که خیلی عالی است. اگر نه، پس از خودتان می‌پرسید که آیا سنجه پول انتخابی برای آزمون از بین چندین سنجه قابل‌تامل شاید سنجه درستی نباشد و دوباره تحلیل خود را انجام می‌دهید. اگر به نتیجه دلخواه نرسیدید می‌توانید تکانه عرضه از قبیل افزایش شدید قیمت نفت را هم بیافزایید. هر کسی با به کار گرفتن قدرت تخیل خویش می‌تواند چندین روش دیگر برای اصلاح آزمون خود پیدا کند. پس هر زمان یکی از این روش‌ها سرانجام از فرضیه‌تان پشتیبانی کرد می‌توانید با افتخار اعلام کنید که «داده‌ها از فرضیه من پشتیبانی کردند.» این فرآیند شکنجه کردن داده‌ها نام‌های بسیاری دارد که در بین آنها «داده‌کاوی»، «وارسی داده‌ها» و «صید داده‌ها» نامیده می‌شود. با وجودی که بسیاری متعجب می‌شوند این کار در سطح گسترده انجام می‌شود.

یک دلیل چنین کاری این است که اغلب اوقات فرضیه مورد آزمون از مفاهیمی مثل «پول» استفاده می‌کند که همتای روشن و بی‌ابهامی در داده‌های موجود ندارند؛ پول را می‌توان چنان باریک تعریف کرد که اسکناس و مسکوک در گردش به‌علاوه سپرده‌های دیداری باشد یا تعریفی گسترده داشته باشیم که سپرده‌های مدت‌دار و سهام در صندوق تعاونی بازار پول را شامل شود. به‌علاوه تئوری ما معمولا مشخص نمی‌سازد چه مدت زمان می‌برد تا اثرات پیش‌بینی شده رخ دهد و آنچه که سایر متغیرها باید در نظر بگیرند؛ بنابراین اگر در نخستین کوشش موفق نشدید، کاملا منطقی است که فرضیه خود را متهم نسازید، بلکه ایراد را در متغیرهای خاص و وقفه‌های زمانی که استفاده کرده‌اید یا در تصریح روش آماری از قبیل تبدیل داده‌ها به لگاریتمی بدانید. هرگز نمی‌توان هیچ فرضیه‌ای را در انزوا آزمون کرد: آزمون همیشه شامل فرضیه‌های جانبی است از قبیل شیوه درست اندازه‌گیری متغیرهای معین، یا طول وقفه‌های معین. از آنجا که ما نمی‌توانیم اینها را با اعتماد زیادی در همان آغاز مشخص سازیم، چاره‌ای نداریم که چندین نوع از آنها را امتحان کنیم. وضعیت ایده‌آل زمانی است که دو یا چندین مجموعه داده‌ داشته باشیم و یکی از آنها را استفاده کنیم تا سنجه‌ها، وقفه‌ها و... درست را پیدا کنیم و سپس این اطلاعات را برای آزمون فرضیه با مجموعه داده‌های دیگر استفاده کنیم، اما اغلب فقط یک مجموعه داده در دسترس است.

این مشکل منحصر به علم اقتصاد نیست. اینکه فرضیه باید مشترکا آزمون شود در علوم طبیعی نیز صادق است. و اینکه تنها بهترین نتایج عرضه می‌شود نیز منحصر به علم اقتصاد نیست. وقتی برخی شرکت‌های دارویی داروهای جدید را آزمون می‌کنند و نتیجه منفی به دست می‌آورند، آنها دوباره و دوباره آزمون می‌کنند با این امید که سرانجام یک نتیجه مثبت به دست خواهند آورد که سپس قابلیت انتشار عمومی دارد.

واکنش معقول این نیست که نتیجه به دست آمده در هر بررسی، چه در اقتصاد یا در سایر حوزه‌ها را خیلی جدی بگیریم، بلکه باید منتظر باشیم تا توسط سایر بررسی‌ها با استفاده از داده‌های جدید و با روش‌های متفاوت تایید گردد. این نیز به مساله قبلا بحث شده خطای داده‌ها کمک خواهد کرد، اما دفاع از چنین صبر و بردباری اغلب توصیه غیرواقع‌بینانه‌ای است. بیشتر بررسی‌ها تکرار نمی‌شوند چون نتایج آنها به اندازه‌ای مهم ملاحظه نمی‌شوند که ارزش زمان یک شخص را داشته باشد؛ یا اگر ارزش داشته باشد و تکرار بررسی به همان نتایج بررسی اولیه برسد، سردبیران نشریات علمی، چنین مقالاتی را آنقدر باارزش نمی‌بینند که دوباره منتشر شوند چون به حد کافی اصیل نیستند که همین امر انگیزه انجام چنین بررسی‌هایی را از همان اول کم می‌کند. به علاوه شاید فقط یک مجموعه داده‌ها در دسترس باشد به طوری که تکرار کردن بررسی، برخی از مشکلات بررسی اولیه را همچنان داشته باشد.

دروغ گفتن و پیچاندن

مادامی که کسانی هستند که تحت‌تاثیر اعداد قرار می‌گیرند چون اعداد حالتی دقیق، ریاضی‌وار؛ بنابراین «علمی» دارند، ذخیره کافی آمار ساختگی وجود خواهد داشت که برخی از آنها یکسره دروغ هستند، اما نیازی نیست دروغ تابلوداری گفت تا تاثیر نادرستی بر جا گذاریم. پیچاندن همین کار را می‌کند. یک مثال از اطلاعات غلط دادن با عبارات فنی درست این است که بگوییم «تا حداکثر» یا «تا حداقل». یک فروشگاه دروغ نمی‌گوید وقتی که ادعا می‌کند قیمت‌های خود را «تا حداکثر ۵۰ درصد» کاهش داده است هر چند که فقط قیمت یکی از ۳۰۰۰ قلم کالای در معرض فروش خود را بیش از ۵ درصد کاهش داده است و احتمال بیشتری می‌رود که مشتریان «۵۰ درصد» را به جای «تا حداکثر» به یاد داشته باشند.

خرده‌فروش‌ها و تبلیغاتچی‌ها تنها شیادها نیستند. مقامات دولتی نیز با موفقیت می‌پیچانند، هم چون اگر دستشان رو شود که دروغ روشنی گفته‌اند شرمندگی بسیاری برایشان می‌آورد. پس آنها باید در اطلاعات غلط‌دادن به عموم احتیاط کنند، اما آنها هر کاری بتوانند می‌کنند. برای مثال چون نیروی کار در حال افزایش است، این امکان هست که تعداد شاغلان نسبت به گذشته افزایش یابد در حالی که نرخ بیکاری نیز بالا می‌رود. اگر این اتفاق بیفتد، گزارش خبری که کاخ سفید منتشر می‌کند، به احتمال زیاد بر رقم اشتغال تاکید می‌ورزد و نرخ بیکاری را نادیده می‌گیرد در حالی که اگر عکس آن اتفاق بیفتد احتمال بیشتری می‌رود که دولت بر کاهش نرخ بیکاری تاکید نماید. به علاوه تعاریف نیز تغییر می‌کنند تا با نیازها جور درآیند. برای مثال وقتی آیزنهاور با احتمال کسری بودجه کوچک اما نمادین مواجه شد، فدرال رزرو را (که در خارج از بودجه بود) ترغیب کرد تا مقداری از وجوه خود را به خزانه بدهد به طوری که بودجه ظاهرا متوازن شود، اگرچه آنچه اتفاق افتاد انتقال بی‌معنی از یک جیب دولت به جیب دیگر بود. به دنبال آن، جانسون برای اینکه کسری منتشره نه واقعی را کاهش دهد صندوق امانات تامین اجتماعی را وارد بودجه کرد. و در سال ۲۰۰۶ وقتی کسری بودجه کمتر از میزان سال قبل بود کاخ سفید اعلام کرد که این نشان‌دهنده موفقیت سیاست مالی بوش بوده است. این گزارش اشاره‌ای نکرد که پیش‌بینی‌های بودجه نشان می‌دهد کسری بودجه در سال‌های بعدی به شدت افزایش خواهد یافت. گزارش مطبوعاتی دولت دروغ نگفت؛ فقط در اعلام حقیقت، صرفه‌جویی به خرج داد. پیش‌بینی‌ها برای سال‌های آتی، همچنین «تعدیلاتی» که دولت‌های آیزنهاور و جانسون انجام دادند اطلاعات عمومی در دسترس بود به طوری که دولت را نمی‌توان متهم به پنهان‌کاری شدید کرد.

سطوح پایین‌تر دولت نیز آمادگی پیچاندن دارند. دیوید کاولز مثال روشنگرانه زیر را پیدا کرد: اداره منابع طبیعی مینه‌سوتا اظهار کرد که شورای ایمنی ملی گزارش داده است تعداد کسانی که به اتاق درمان اورژانس به خاطر زخم‌های ورزشی مراجعه می‌کنند در هر ۱۰۰ هزار نفر شرکت‌کننده در شکار، کمتر از رشته‌های فوتبال، بیسبال، بیلیارد و پینگ پنگ است. آن طور که کاولز به درستی اشاره می‌کند این گزارش وخامت و شدت زخم‌ها را نادیده می‌گیرد و نیز تعداد کسانی که به جای رفتن به اتاق اورژانس سر از سردخانه درآورده‌اند و نیز میزان وقتی را که مردم صرف شکار می‌کنند که در مقایسه با سایر ورزش‌ها بسیار کمتر است در نظر نمی‌گیرد.

فعالان اجتماعی نیز می‌توانند تور عالی ببافند؛ بنابراین

«ائتلاف نجات دارفور» یک تبلیغات منتشر کرد که تعداد کشته‌های دارفور را ۴۰۰ هزار «مرد، زن و کودک بیگناه» اعلام می‌کرد وقتی حداکثر رقم واقعی که می‌توان برای کشته‌ها داد نصف آن بود. آنطور که جوئل بست توضیح می‌دهد: مطبوعات از فعالان اجتماعی درخواست آمار می‌کنند... فعالان اجتماعی با دانستن اینکه اعداد بزرگ نشان‌دهنده مشکلات بزرگی است و اینکه مردم را وادار به کاری کردن بسیار سخت است مگر اینکه مردم متقاعد شوند مشکل بزرگی وجود دارد (و صادقانه باور کنند) تخمین‌های بزرگی ارائه می‌دهند.» آیا باید آنها را به خاطر چنین کاری سرزنش کرد؟» تصور کنیم شما یک فعال اجتماعی در حوزه بی‌خانمان‌ها هستید. شما مطمئن هستید که مشکل بی‌خانمانی بسیار بزرگ‌تر از آن چیزی است که بیشتر مردم فکر می‌کنند. کوتاه زمانی پیش از اینکه با تلویزیون مصاحبه کنید با دو برآورد از تعداد کودکان بی‌خانمان برخورد می‌کنید که رقم یکی دو برابر دیگری است. هیچ راه و فرصتی برای اینکه بفهمید کدام‌یک درست است ندارید. باید چکار کنید؟ اگر هر دو برآورد را ذکر کنید و بی‌طرف بمانید این‌طور به نظر می‌رسد که بی‌اطلاع از قضایا هستید؛ بنابراین کارآمدی پیامتان کاهش می‌یابد. آیا منصفانه است که شما را بابت بی‌صداقتی مقصر بدانیم اگر که فقط برآورد بالاتر را ذکر کنید؟ پاسخ من بلی است. برایم قابل‌درک است چرا دیگران با من موافق نیستند، اما آنها باید از شیب لغزنده آگاه باشند. نقطه بعدی در این شیب، استفاده از برآورد بالاتر است حتی اگر فکر کنید که برآورد پایین‌تر احتمال بیشتری دارد درست باشد و به زودی در نقطه‌ای قرار می‌گیرید که برآورد بالاتر را استفاده می‌کنید هر چند که می‌دانید نادرست است. سیاستمداران به خصوص در معرض این وسوسه هستند، همان‌طور که شخصیت‌های رادیو و تلویزیون هستند.

اگر شما فکر می‌کنید سر خوردن زیاد در یک مسیر شیب‌دار بسیار بعید است پس این را نگاه کنید. یک نظرسنجی در ۱۹۹۱ گزارش داد که ۵/۱۱ میلیون کودک آمریکایی در خطر گرسنگی قرار دارند. این به نظر وحشتناک می‌رسید به خصوص اگر کسی «در خطر» گرسنگی را واقعا با گرسنه بودن یکی بگیرد، آنطور که یک خواننده بی‌دقت احتمالا دچار آن می‌شود، اما این نظرسنجی یک بچه را در خطر گرسنگی می‌دانست اگر والدین وی به هر یک از مجموعه پرسش‌های خاص پاسخ بلی می‌دادند که یکی از آنها این بود: «آیا شما به خاطر ته کشیدن پولتان برای خرید مواد غذایی، تاکنون مجبور شدید به تعداد محدودی خوراکی برای تغذیه کودکانتان متکی شوید؟» که اصلا تعریف خوبی از «گرسنگی» نیست. در مثال دیگری، توماس سوول نقل می‌کند که وقتی نشان داده شد ادعاهای به عمل آمده در این‌باره که با ارائه مراقبت پیش از زایمان چقدر پول صرفه‌جویی شده است توجیه نداشتند، رییس دپارتمان تندرستی جنین و پیش از زایمان در مدرسه تندرستی عمومی هاروارد پاسخ داد که «توجیه این خدمات با تحلیل هزینه و فایده ضعیف است،» اما آن را توجیه کرد چون «مردم به این نوع تلاش وادار شدند،» چرا که سیاستمداران «اکراه دارند پول را برای خدمت به فقرا خرج کنند.» به عبارت دیگر، وارونه جلوه دادن ایرادی ندارد اگر برای آرمان خوبی باشد. و این کار در محیط دانشگاهی می‌شود!

بی‌دقتی و نادانی

در حالی‌که عمدا پیچاندن واقعیات کاری نکوهیده است، خطاهای صادقانه اما ناشی از بی‌توجهی نیز اطلاعات گمراه‌کننده زیادی تولید می‌کند. برخی اوقات تقصیر آن نه بر عهده تولیدکننده داده‌ها بلکه خواننده است. فرض کنید یک گزارش خبری ابراز می‌دارد «تا حداکثر پنجاه نفر مردند.» اگر در آن لحظه‌ای که خبر خوانده شده است پرسش شود، تعدادی از خوانندگان خبر را به خوبی فهمیده‌اند و می‌گویند دقیقا نمی‌دانند چند نفر مرده‌اند فقط اینکه بیشتر از پنجاه نفر نبوده است، اما من گمان می‌کنم اگر یک ساعت بعد از آنها پرسیده شود اکثریت جواب خواهد داد «پنجاه نفر» یا احتمالا «حدود پنجاه نفر.» اعداد در حافظه ما دوام بیشتری می‌آورد تا شرط و شروطی که برای آنها در نظر گرفتیم. یک تیتر روزنامه نیویورک تایمز نوشته بود «نیروی ناتو می‌گوید ۷۰ نفر از طالبان در جنگ شبانه کشته شدند.» در حالی‌که خود مقاله گزارش می‌دهد که «نیروهای ناتو و افغان احتمالا تا حداکثر ۷۰ نفر... را کشته‌اند.» دیوید مورای، جوئل شوارتز و رابرت لیختر مثال‌های فراوانی می‌آورند که چگونه رسانه‌ها نتایج بررسی‌های علمی را اشتباه برداشت می‌کنند. جوئل بست یک مقاله سال ۱۹۹۵ را از نشریه‌ای بدون ذکر نام می‌آورد که ادعا می‌کند «هر سال از ۱۹۵۰ تعداد بچه‌های آمریکایی که به ضرب گلوله کشته شده‌اند دو برابر شده است.» نویسنده مقاله اطلاعات دریافتی از منبع خود را مخدوش کرده است. گزارش سال ۱۹۹۴ می‌گوید «از ۱۹۵۰ تاکنون» تعداد بچه‌هایی که در یک سال با اسلحه کشته شده‌اند دو برابر شده است- که کاملا متفاوت از دو برابر شدن تعداد کشته‌ها «در هر سال» است.

وقتی اداره آمار یک گزارش درباره ازدواج منتشر کرد که نشان می‌داد کمتر از نصف تمام ازدواج‌هایی که بین ۱۹۷۵ و پایان ۱۹۷۹ انجام شده است تا ۲۵امین سالگردشان دوام آورده است، سر و صدای زیادی به پا کرد که خانواده آمریکایی دچار بحران است و اینکه باید کاری در این باره صورت گیرد. کاری که باید انجام شود توجه به این نکته است که ازدواج‌های انجام شده در اواخر دهه ۱۹۷۰ همگی شانس این را نداشتند تا به ۲۵مین سالگرد خود برسند و وقتی این عامل را در نظر می‌گیریم، گزارش نشان می‌دهد که نرخ طلاق افزایشی نبوده است.

داده بی‌مصرف وارد کنید- داده بی‌مصرف بیرون می‌آید

دانشمندان علوم کامپیوتر این عبارت را برای وضعیت‌هایی ساخته‌اند که قرار است کامپیوترها با دریافت داده‌های بی‌ارزش، نتایج عالی بیرون دهند. همین مشکل در علم آمار مطرح می‌گردد. آمار توانایی پاسخ دادن به پرسش‌های بسیاری را دارد- مادامی که اهمیت نمی‌دهید آیا پاسخ درست است یا خیر. و چون بیشتر مردم اهمیت نمی‌دهند باید مراقب «پاسخ‌ها» به پرسش‌های غیرقابل‌پاسخ دادنی باشید. برای نمونه، اطلاعات دقیق درباره رفتار شخصی خصوصی، یا موضوعات بالقوه شرم‌آور مثل مصرف مواد مخدر یا نوشیدن مشروبات را باید با شک و تردید نگاه کرد. همچنین پاسخ‌هایی که به پرسش‌هایی داده می‌شود که پاسخگو فاقد اطلاعات لازم است. برای مثال پرسش‌هایی که از مردم درباره تغییر درآمد از سال قبل می‌شود داده بی‌مصرف تولید می‌کند: مردم آن را به خاطر ندارند. و نیز این پرسش که «شما سال گذشته چقدر پس‌انداز کردید؟» این پرسش باید به نحو دقیق‌تری بیان شود. و به داده‌ها از نظرسنجی‌هایی که پاسخ‌دهندگان انگیزه دستکاری در نتایج دارند اعتمادی نکنید. بسیاری سال‌های پیش، مجلس ایالتی کالیفرنیا نگران کاهش توجه به امر آموزش در دانشگاه کالیفرنیا شد و درخواست کرد تا یک نظرسنجی انجام شود که اعضای هیات علمی وقت کاری خود را چگونه پر می‌کنند. به این جهت، دانشگاه به اعضای هیات علمی گفت جدول استفاده از وقت روزانه خود را به مدت یک هفته تکمیل نمایند. نه فقط هیچ روشی وجود نداشت که گواهی کند آنها حقیقت را گفته‌اند بلکه اساتید به آسانی می‌توانستند کارهای خود را از یک هفته به هفته بعد جابه‌جا سازند و برای مثال این هفته وقت بیشتری را صرف آموزش کنند مثلا با آماده ساختن یادداشت‌های ارائه درس یا پرسش‌های امتحانی که برای هفته‌های بعدی نیاز است و در عوض کارهای پژوهشی خود را از این هفته به هفته‌های بعد جابه‌جا نمایند؛ بنابراین نمی‌توان نتایج این نظرسنجی را جدی گرفت.

برخی مسائل دیگر

مشکل دیگری که برخورد می‌کنیم به قلمرویی مربوط می‌شود که فرضیه مورد آزمون به‌کار می‌رود. فرض کنید داده‌ها نشان می‌دهد که یک سال تحصیلات بیشتر، باعث یک و نیم سال افزایش طول عمر می‌شود. آیا منظور این است که با صرف بیست سال بیشتر در دانشگاه (مثلا گرفتن چهار یا پنج دکتری) مردم به طور متوسط می‌توانند طول عمر خود را سی سال افزایش دهند؟ البته که نه: این داده‌ها از مشاهدات مربوط به مردمی آمده است که سطح نسبتا معمولی تحصیلات دارند (مثلا دیپلم) و دلیلی ندارد که فرض کنیم آن نتایج برای مواردی خارج از این دامنه هم کاربرد دارد. حقیقتا حتی درون دامنه سال‌های تحصیلات که واقعا در نمونه مشاهده شده است، خوبی برازش داده‌ها شاید تماما به علت تجمع شدید جمعیت در آن دامنه خاص باشد.

برخی از مهم‌ترین تکنیک‌ها در علم آمار در بستر آزمایش‌های کشاورزی گسترش یافت که آزمایش‌کننده اطمینان داشت نمونه تصادفی است و اثراتی را که تحقیق می‌کرد بر تکه زمین‌های تصادفی به کار می‌برد، اما در اقتصاد کلان و برخی اوقات در اقتصاد خرد، بیشتر داده‌هایی که در اختیار ما قرار می‌گیرد در دست آزمایش‌کننده نبوده بلکه از تاریخ گرفته‌ایم به طوری که هر یک از مشاهدات ما تصادفی نیستند. برای مثال GDP فصل سوم و فصل چهارم سال ۲۰۰۸ مشاهداتی مستقل نیستند، آنچه در اولی اتفاق می‌افتد روی دومی تاثیر می‌گذارد در حالی‌که یک متغیر از قبیل سیاست پولی که بر GDP در یک فصل تاثیر می‌گذارد در فصل بعدی نیز تاثیر دارد.

هشدار نهایی: مراقب داده‌هایی باشید که دهان به دهان می‌چرخند بدون اینکه با هر طناب قابل‌پذیرفتنی به منبعی وصل شده باشند. اگر کسی به شما می‌گوید در یک سال معمولی پای ۲۱۱۳۴ آمریکایی به گربه گیر می‌کند، باید این پرسش پیش بیاید که واقعا چه کسی توانسته است اینها را حساب کند.

مشکلاتی که تا اینجا ذکر شد تنها مشکلاتی نیستند که وظیفه اغلب دشوار استنتاج اطلاعات درست از داده‌های موجود را پیچیده می‌کنند. مشکل دیگر اجتناب از مغالطه رگرسیونی است که مستلزم درک نمونه‌گیری است و مشکل دیگر، استنتاج علیت از همبستگی‌های مشاهده شده است که در بخش بعدی به آنها خواهیم پرداخت.