میانگینها مفیدند اما...
باید به این نکته توجه کرد که هیچ شاخص آماری نمیتواند تمام حقایق موجود در یکسری داده را بیان کند، بنابراین بسیاری از دروغگویان با استفاده از همین کاستی، با گزارش شاخصهای نامناسب، تصویری غیرواقعی از حقایق جامعه را ارائه میدهند. بدونتردید بیشتر مردم با واژه میانگین از ابتدای کاربرد آن در کارنامه تحصیلی با عنوان معدل نمرات تا کاربردهای پیچیدهتر آن برای برآورد میانگین نرخ تورم، نرخ رشد اقتصادی، درآمد سرانه و نرخ ارز کم و بیش آشنایی دارند. شاید مهمترین موضوع در مطالعه هر جامعه آماری تعیین مقدار مرکزی دادهها باشد. در آمار برای اندازهگیری مرکز جامعه ملاکهای متعددی مانند میانگین حسابی، میانه، نما، میانگین هندسی، میانگین هارمونیک و... مورد استفاده قرار میگیرد، ولی طیف گستردهای از کاربردهای سه شاخص مرکزی معروف و مهم، یعنی میانگین حسابی(مجموع دادهها تقسیم بر تعداد داده)، میانه(داده وسط در دادههای مرتب شده) و نما(داده با بیشترین تکرار) در بسیاری از پژوهشها و گزارشهای آماری باعث تمرکز مطلب روی استفاده و سوءاستفاده از آنها شده است. با وجود اینکه اساس این شاخصها گزارههای منطقی و نظریههای ریاضی است، ولی استفاده تعمدی یا بهکارگیری نادرست آنها برای کسب منافع شخصی، سازمانی و سیاسی، به شکل قابل ملاحظهای رایج شده است.
چگونه شگردها و استفاده نامناسب از شاخصهای مرکزی مخاطبان را گمراه میکنند؟ مخاطبان با دقت به چه مواردی میتوانند صحت آنها را مورد بررسی قرار دهند؟ سوالاتی است که در این مطلب به آن پاسخ داده میشود. به چند مثال در مورد استفاده مغرضانه از شاخصهای مرکزی دقت کنید. مدیرعامل یک شرکت برای نشان دادن توان مالی آن و جذب نیروی کار جدید، حقوق ماهانه کارکنان را بهطور متوسط ۵/ ۴ میلیونتومان اعلام میکند. اگر حقوق ماهانه ۱۰ کارمند شرکت بهترتیب ۵/ ۱۱،۶/ ۱۰،۱/ ۳،۴/ ۳،۵/ ۳،۸/ ۲،۵/ ۲،۵/ ۲،۵/ ۲و۲/ ۲ میلیونتومان باشد به درستی میتوان ادعا کرد میانگین حسابی کارکنان معادل۵/ ۴و میانه معادل ۳ است. در اینجا میانگین حسابی تحتتاثیر دو حقوق با بیشترین مقدار قرار گرفته و موجب برآورد حداکثری برای این شاخص شده است. بنابراین مدیرعامل به تناسب موقعیت و منفعت خود از میانگین حسابی که بیشترین مقدار حقوق را نمایش میدهد، استفاده میکند.
متوسط قیمت فروش هر مترمربع از واحدهای نوساز براساس اطلاعات ثبت شده در بنگاههای معاملات املاک یک شهر، از فروش ۱۵۰ واحد طی سالجاری، به ترتیب برای میانگین حسابی ۴/ ۱۵، میانه ۵/ ۱۴ و نما ۷/ ۱۲ میلیونتومان بهدست آمده است. یک مالک ممکن است به منظور تشویق خریدار به خرید خانهاش از میانگین حسابی که بیانگر بیشترین متوسط قیمت است، استفاده و قیمت واحد خود را ارزان قلمداد کند یا خریدار هوشمندی برای دریافت تخفیف از فروشنده، از نما که بیانگر کمترین قیمت است، استفاده کند. یک سازمان دولتی به منظور تاکید بر لزوم افزایش حقوق کارکنان خود، کمترین مقدار بهدست آمده از محاسبه سه شاخص مرکزی را گزارش میکند. در مقابل دولت بیشترین شاخص را به منظور تاکید بر وضعیت معیشتی خوب کارکنان آن سازمان و با هدف مخالفت با افزایش حقوق اعلام میکند. رئیسجمهور کشوری با اعلام متوسط درآمد مردم، نتیجه میگیرد که مردم آن کشور در رفاه بیشتری نسبت به سایر کشورهای منطقه هستند. مثالهایی از این نوع فراوان است. قطعا این عبارتها تا زمانی که بیان نشود از کدام شاخص و کدام داده استفاده شده، بیمعنی هستند و صداقت در ارائه آمار را نشان نمیدهند. انتخاب دقیقترین شاخص مرکزی دادهها همیشه کار سادهای نیست و توجه به مزایا و معایب هرکدام ضروری است. میانگین حسابی معروفترین و پرکاربردترین شاخص مرکزی است و از آنجاکه از تقسیم مجموع دادهها بر تعدادشان محاسبه میشود، محاسبه آن ساده و واحد آن با واحد داده یکی است و همه دادهها در برآورد آن نقش دارند. از اینرو تصویر کاملتری از تمام دادهها نمایش میدهد. استفاده از میانگین حسابی معایبی نیز دارد ازجمله تاثیرپذیری شاخص از دادههای خیلی بزرگ یا خیلیکوچک که اثر نامطلوب داشته و باعث بزرگنمایی یا کوچکنمایی آن میشوند. میانگین حسابی تنها برای دادههای کمی قابل محاسبه بوده و برای دادههای اسمی مانند جنسیت، وضعیت تاهل، گروهخونی، شهرها و شغل یا دادههای ترتیبی مانند آنچه در پرسشنامهها با عنوان میزان رضایت شغلی، میزان فرهنگ کارآفرینانه در سازمانها و سطوح تحصیلی افراد مورد سوال واقع میشود، کاربرد ندارد. میانه، شاخصی است که تقریبا نصف دادهها از آن کوچکتر هستند. از مزایای استفاده از آن میتوان به سادگی الگوریتم مرتبسازی در دادههای کمی و کیفی و عدم تاثیرپذیری از مقادیر بسیار بزرگ یا بسیار کوچک اشاره کرد. در انتخاب میانه تعداد داده اهمیت داشته و دادههای بالا و پایین میانه اهمیت ندارد. بنابراین از اطلاعات کمتری از دادهها استفاده میشود. از شاخص میانه بیشتر در محاسبه متوسط دادهها با اندازههای دورافتاده و دادههای ترتیبی استفاده میشود. نما، سادهترین شاخص مرکزی است و معمولا زمانی که هدف دسترسی سریع و کلی به متوسط دادهها است، استفاده میشود. در این شاخص، نوع دادهها اهمیت ندارد، ولی بیشتر برای دادههای اسمی استفاده میشود. این شاخص همانند میانه نسبت به دادههای بسیاربزرگ و بسیار کوچک حساس نیست. از معایب آن عدم اعتبار در تعداد کم دادهها، وابستگی به تنها یک عدد با بیشترین تکرار و حساسیت نسبت به تغییرات در تکرار دادهها است. این شاخص بهدلیل اینکه اطلاعات زیادی در اختیار مخاطب قرار نمیدهد، معمولا به تنهایی گزارش نمیشود. از سوی دیگر هر مجموعه داده ممکن است بیش از یک نما داشته باشد. برای بررسی این موضوع که بیشترین مخاطب یک برنامه تلویزیونی از کدام قوم کشور است یا بهطور متوسط تعداد مخاطبان جلسات سخنرانی کدام نامزد انتخاباتی از همه بیشتر است؟ نما بهترین گزینه است. در شرایطی که دادهها نرمال، متقارن و فاقد اعداد دورافتاده هستند، معمولا این سه شاخص اختلاف چشمگیری با هم ندارند. بدیهی است که شناخت داده اولین و مهمترین گام و استفاده از حداقل دو شاخص به جای یک شاخص، دومین گام برای مقابله با سوءاستفاده از آنها است. همچنین آگاهی کافی از مفاهیم آماری برای گزارشدهنده و استفادهکننده ضرورتی اجتنابناپذیر است. بر همین اساس تاکید میشود در هر نوع استفاده از آمار باید محتاط بود، زیرا هیچ روش آماری به تنهایی از بروز اشتباه و استدلال غلط جلوگیری نمیکند. امروزه آگاهی افراد از اهمیت آمار و مفاهیم صحیح آن به «سواد آماری» معروف است. تسلط شهروندان به علم و هنر آمار دارای اهمیت اساسی بوده و تقویت سواد و ارتقای دانش و مهارتهای فردی در تشخیص دروغهای آماری برای مقابله با سوءاستفاده از اطلاعات آماری ضرورت دارد. ضمن تبریک اول آبان، روز ملی آمار و برنامهریزی به فعالان این حوزه، خاطر نشان میشود این روز میتواند نقطه عطفی در توسعه سواد و فرهنگ آماری در کشور باشد.
ارسال نظر