هشت عامل خطای پیشبینی
پس از انتخابات ریاستجمهوری سال ۲۰۱۶ آمریکا، ناظران این پرسش را مطرح کردند که آیا سیستم نظرسنجی در این کشور همچنان وظیفه تولید اطلاعات دقیق را برعهده دارد یا نه؟ خطاهایی که در آن سال در نظرسنجیها رخ داد برخی محدودیتهای نظرسنجی را آشکار کرد؛ البته بازبینی نظرسنجیهای ملی سالهای ۲۰۱۶ و ۲۰۱۸ نشان میدهد نظرسنجیها اگر با دقت انجام شوند نتایج قابل اتکا در اختیار قرار میدهند. برای جلوگیری از تکرار بدبینیهایی که پس از انتخابات ریاستجمهوری سال ۲۰۱۶ درباره نظرسنجیها بهوجود آمد، کاستن از شکاف بین تصورات و واقعیتها درباره نحوه نظرسنجی و هدف آن ضروری است.
مردم دیدگاهها و تصورات گوناگون درباره نظرسنجی دارند که اغلب صحیح نیست. محیط واقعی که نظرسنجیها در آن انجام میشود به محیط و شرایط ایدهآلی که در کتابهای درسی توصیف شده است، شباهت کمی دارد. در مطلب حاضر به نکاتی اشاره میشود که مردم باید درباره نظرسنجیها بدانند. نخستین نکته این است که سازمانهای نظرسنجی هر یک به شیوه خاص خود نظرسنجی میکنند. درحالحاضر خبرگزاریهای سیانان و فاکسنیوز از طریق تماس تلفنی و مصاحبه زنده نظرسنجی میکنند، خبرگزاری سیبیاس نیوز و پولیتیکو به شکل آنلاین و آسوشیتدپرس به شیوهای دیگر این کار را انجام میدهند. همچنین برخی سازمانها ترکیبی از روشها را بهکار میگیرند. رویکردهای مختلف بر کیفیت دادههایی که جمعآوری میشود، اثر میگذارد.
دومین موضوع مهم این است که موانع ورود به حوزه نظرسنجی از میان رفته است. فناوری همان تاثیری را بر نظرسنجی داشته که بر روزنامهنگاری داشته است؛ به این معنا که اکنون هرکس میتواند نظرسنجیهایی در سطح ملی انجام دهد و مسلما این تحول، نقاط مثبت و منفی دربردارد. برای مثال شاهد افزایش شدید تعداد سازمانهای نظرسنجی هستیم که تواناییهای علمی و تجربه کافی برای انجام این کار را ندارند. سال ۲۰۱۶ همین عامل سبب شد تعداد بسیار زیادی از نظرسنجیهای فوری و ارزان انجام شود و اکثر آنها دچار اشتباهی قابل اجتناب شدند؛ یعنی در این نظرسنجیها تعداد بسیار زیادی افراد تحصیلکرده شرکت کرده بودند که همگی طرفدار هیلاری کلینتون بودند. در اعلام نتیجه این نظرسنجیها به این نکته توجه نشد و این باور بهوجود آمد که کلینتون بسیار بیش از ترامپ طرفدار دارد.
سومین موضوع مهم این است که گاه یک نظرسنجی «ملی» معرفی میشود؛ اما این به آن معنا نیست که روش انجام آن صحیح و قابل اعتماد است. عبارت «در سطح ملی» هنگامی که برای نظرسنجی استفاده میشود این دیدگاه را در شنونده بهوجود میآورد که این نظرسنجی قابل اتکا است؛ اما واقعیت این است که این عبارت هیچ اطلاعات خاص تکنیکی در اختیار قرار نمیدهد و نیز تضمینی وجود ندارد که این نظرسنجی به درستی انجام شده باشد و واقعا نظر طیفی گسترده از مردم در مناطق مختلف کشور را نشان دهد. متاسفانه عبارتهای مختلف دیگر هم برای ایجاد اطمینان در مخاطب مورد استفاده قرار میگیرد که گاه نقایص در روش انجام نظرسنجی را پنهان میکند؛ نقایصی که سبب میشود نتیجه کار قابل اطمینان نباشد.
چهارمین موضوع پراهمیت این است که حاشیه واقعی خطا اغلب دو برابر رقمی است که اعلام میشود. این جمله که حاشیه خطای یک نظرسنجی مثبت و منفی ۳ درصد است، این باور را بهوجود میآورد که نظرسنجی انجامشده دقیقتر از میزان واقعی است. اما چرا چنین است؟ نکته نخست اینکه حاشیه خطا تنها یک منبع خطا را در نظر میگیرد؛ یعنی این واقعیت که نمونههای رندم، احتمالا دیدگاه کل جمعیت را نشان نمیدهند. اما در سه منبع دیگر خطا وجود دارد که همین اندازه مهم هستند: نرخ پاسخ ندادن به سوالات نظرسنجی، خطای پوشش (از تمام جمعیت هدف نمونهگیری نشده است) و ارزیابی اشتباه که ممکن است از سوی مصاحبهکننده، پردازشکننده دادهها و دیگر دستاندرکاران نظرسنجی رخ دهد. حاشیه خطا نه تنها این سه منبع دیگر خطا را شامل نمیشود، بلکه این دیدگاه را در مخاطب بهوجود میآورد که اساسا این سه خطا وجود ندارد؛ درحالیکه وجود دارد. تحقیقات مختلف نشان میدهد متوسط خطا در یک نظرسنجی نزدیک ۶ درصد است نه ۳ درصد. اگرچه نظرسنجیها از این جهت که نظر مردم را درباره موضوعات مهم نشان میدهند، مفید هستند؛ اما این خطاهای پنهان این واقعیت را هویدا میکنند که نظرسنجیها به اندازهای دقیق نیستند که بتوان بر مبنای آن فرد پیروز را در یک انتخابات شناسایی کرد.
پنجمین موضوع مهم این است که تصور میشود تعداد بالای افراد شرکتکننده در نظرسنجی بر اعتبار نظرسنجی میافزاید؛ اما گاه چنین نیست. به دانشجویانی که درباره نظرسنجی مطالعه میکنند گفته میشود تعداد بسیار زیاد افراد شرکتکننده در نظرسنجی نشانهای از کیفیت بالای نتایج است؛ اما با آنکه از لحاظ تئوری این دیدگاه درست است؛ اما در نظرسنجیهای مدرن واقعیت چیز دیگری است. یکی از کارشناسان میگوید: در اغلب موارد برای انجام نظرسنجیهای بسیار گسترده، از روشهای ارزان و پرنقص استفاده میشود. افزودن بر تعداد افراد با سوگیری خاص به مجموعه افرادی که در نظرسنجی شرکت میکنند، کیفیت نتایج را بالا نمیبرد. برای مثال اگر در یک نظرسنجی افراد در سنین بالا، مجرد، دارای گرایش سیاسی خاص و با درآمد پایین مورد نظرسنجی قرار گیرند نتیجه بهدستآمده را نمیتوان بهکل جمعیت تعمیم داد و تعداد بسیار بالای افراد شرکتکننده در چنین نظرسنجی کیفیت آن را بالا نمیبرد.
ششمین موضوع این است که شواهد نشان میدهد وقتی به عموم مردم گفته میشود به احتمال بسیار بالا یک نامزد پیروز خواهد شد برخی افراد از رای دادن منصرف میشوند. پس از انتخابات ریاستجمهوری سال ۲۰۱۶ برخی به این موضوع فکر کردند که آیا پیشبینیهای فراگیر که نشان میداد هیلاری کلینتون قطعا پیروز خواهد شد سبب شده عدهای فکر کنند نتیجه از همین حالا مشخص است؛ بنابراین رای آنها تغییری در نتیجه ایجاد نمیکند؟ تحقیقات علمی این فرضیه را اثبات کرده است.
هفتمین موضوع این است که تخمین دیدگاه عمومی درباره نامزدها و سیاستهای آنها عموما قابل اتکاست؛ اما تخمین اینکه چه کسی پیروز خواهد شد خیلی قابل اتکا نیست. در انتخابات سال ۲۰۱۶ میزان محبوبیت ترامپ و هیلاری کلینتون پایین بود. بسیاری از آمریکاییها سعی میکردند یکی از این دو را انتخاب کنند و این پرسش برای آنها مطرح بود که آیا رای بدهند یا نه؟ یکی از مسائل مهم این است که مشخص نیست کدامیک از کسانی که در نظرسنجی شرکت کردهاند در انتخابات هم شرکت خواهند کرد و امسال تشخیص این موضوع دشوارتر است؛ زیرا همهگیری کرونا بر تصمیم رایدهندگان برای حضور در انتخابات اثرات مختلف دارد. امسال تعداد بسیار بیشتری از مردم به شکل پستی رای میدهند.
هشتمین موضوع این است که تعدیل آماری که وزندهی نامیده میشود، یک عامل بسیار مهم است و از طریق آن میتوان مطمئن شد گروه شرکتکننده در نظرسنجی، نمونهای از کل جمعیت است. این باور بین محققان وجود دارد که استفاده از این روش صرفا با در نظر گرفتن برخی متغیرها نظیر سن، جنس و نژاد برای دستیابی به نتیجه دقیق، کافی نیست. برخی گروههای جامعه از جمله افراد در سنین بالا و فارغالتحصیلان دانشگاه معمولا بیشتر در نظرسنجیها شرکت میکنند و این یعنی خطا در نتیجه وجود دارد و نمیتوان آن را بهکل جمعیت تعمیم داد.