شیوع پارادوکس سیمپسون در اقتصاد
تصور کنید که زوجی بهدنبال یک رستوران خوب برای شام میگردند، بنابراین هرکدام ازآنها با استفاده از نظرسنجی شبکههای اجتماعی مناسبترین رستوران را برای شام امشب جستوجو میکنند. فرض کنید شوهر رستوران «خورشید» را پیدا کرده که درصد رضایت بیشتری در بین مردان و زنان نسبت به رستورانی دارد که همسرش پیدا کرده است. فرض کنید که نام رستوران منتخب همسر، رستوران «ماه» است. هرچند رستوران خورشید درصد رضایت بیشتری بین زنان و مردان دارد؛ اما زن مدعی است که رستوران او، رضایت کلی بیشتری (بدون در نظر گرفتن جنسیت) نسبت به رستوران خورشید دارد. نکته جالب این است که هر دو براساس یک منبع اطلاعاتی به نتایج کاملا متفاوتی رسیدهاند، حتی بهنظر میرسد حق با هر دوی آنها است و هر دو دلیل موجهی برای ادعای خود دارند. مشکل ناشی از چه چیزی است؟ این تناقض نشاندهنده چیست؟ چه کسی به نتیجه صحیح رسیده است؟ آیا نتایج نظرسنجی اشتباه است یا در محاسبات مشکلی وجود دارد؟
از نظر منطقی، هر دو نفر نتیجه صحیحی گرفتهاند و بدون آنکه بدانند وارد دنیای تناقض سیمپسون شدهاند. مسائلی مثل انتخاب بهترین یا بدترین رستوران و انتخاب درمان مناسب برای کاهش ریسک یک بیماری خاص از جمله مواردی هستند که در آنها براساس دادهها در آن یکسان ممکن است، استنتاجهای افراد، کاملا با یکدیگر متناقض باشد. این تناقض زمانی رخ میدهد که یک مجموعه داده به گروههایی تقسیم شده باشد که نتایج حاصل از آنها در جهت خلاف با حالتی است که دادهها در آن تجمیع شدهاند. در مثال مربوط به رستوران که در بالا ذکر شد، بهنظر میرسد که رستوران خورشید با درصد رضایت بیشتر در بین زنان و مردان باید میزان رضایت بیشتری هم در کل نسبت به رستوران ماه داشته باشد؛ اما اینطور نیست! اعداد زیر میزان رضایت برای هر دو رستوران را به تفکیک زن و مرد نمایش میدهد. با ترکیب میزان رضایت زنان و مردان در سطر آخر مشخص میشود که رستوران ماه دارای رضایت بیشتری نسبت به رستوران خورشید است.