تصور کنید که زوجی به‌دنبال یک رستوران خوب برای شام می‌گردند، بنابراین هرکدام ازآنها با استفاده از نظرسنجی شبکه‌های اجتماعی مناسب‌ترین رستوران را برای شام امشب جست‌و‌جو می‌کنند. فرض کنید شوهر رستوران «خورشید» را پیدا کرده‌ که درصد رضایت بیشتری در بین مردان و زنان نسبت به رستورانی دارد که همسرش پیدا کرده است. فرض کنید که نام رستوران منتخب همسر، رستوران «ماه» است. هرچند رستوران خورشید درصد رضایت بیشتری بین زنان و مردان دارد؛ اما زن مدعی است که رستوران او، رضایت کلی بیشتری (بدون در نظر گرفتن جنسیت) نسبت به رستوران خورشید دارد. نکته جالب این است که هر دو براساس یک منبع اطلاعاتی به نتایج کاملا متفاوتی رسیده‌اند، حتی به‌نظر می‌رسد حق با هر دوی آنها است و هر دو دلیل موجهی برای ادعای خود دارند. مشکل ناشی از چه چیزی است؟ این تناقض نشان‌دهنده چیست؟ چه کسی به نتیجه صحیح رسیده است؟ آیا نتایج نظرسنجی اشتباه است یا در محاسبات مشکلی وجود دارد؟

از نظر منطقی، هر دو نفر نتیجه صحیحی گرفته‌اند و بدون آنکه بدانند وارد دنیای تناقض سیمپسون شده‌اند. مسائلی مثل انتخاب بهترین یا بدترین رستوران و انتخاب درمان مناسب برای کاهش ریسک یک بیماری خاص از جمله مواردی هستند که در آنها براساس داده‌ها در آن یکسان ممکن است، استنتاج‌های افراد، کاملا با یکدیگر متناقض باشد. این تناقض زمانی رخ می‌دهد که یک مجموعه داده به گروه‌هایی تقسیم شده باشد که نتایج حاصل از آنها در جهت خلاف با حالتی است که داده‌ها در آن تجمیع شده‌اند. در مثال مربوط به رستوران که در بالا ذکر شد، به‌نظر می‌رسد که رستوران خورشید با درصد رضایت بیشتر در بین زنان و مردان باید میزان رضایت بیشتری هم در کل نسبت به رستوران ماه داشته باشد؛ اما این‌طور نیست! اعداد زیر میزان رضایت برای هر دو رستوران را به تفکیک زن و مرد نمایش می‌دهد. با ترکیب میزان رضایت زنان و مردان در سطر آخر مشخص می‌شود که رستوران ماه دارای رضایت بیشتری نسبت به رستوران خورشید است.

Untitled-1

این مطلب برایم مفید است
2 نفر این پست را پسندیده اند