ناسازگاری آماری در نظرسنجی آیپُز
مجله مهر: روز ۲۷ خرداد ۱۳۹۴، مؤسسۀ آیپُز نتایج یک نظرسنجی با عنوان «میراث جنبش سبز و ارزیابی مردم» را منتشر کرد تا «میزان درگیری ذهنی و عینی مردم با این حوادث» و «ارزیابی آنان از این حوادث» را نشان دهد. با اشارۀ یکی از دوستان، متوجه شدم که یافتههای گزارششده در این نظرسنجی گویا ناسازگاریهای آماری جدی دارد به این معنا که بعید است یافتههای گزارششده، حاصل تحلیل آماری یک مجموعۀ دادۀ واقعی (یا حتی ساختگی) باشند بلکه صرفاً نمودارها و درصدهای نهایی حسب سلیقۀ مؤلف طراحی و ارائه شدهاند.
برای رعایت اصول حرفهای و دریافت توضیحات احتمالی، در تاریخ ۳۱ خرداد ۱۳۹۴ از طریق ایمیل به مؤسسه اطلاع دادم ناسازگاریهایی مشاهده کردهام که قصد گزارش آنها را دارم اما شاید در اثر محاسبات نادقیق روی مجموعهای از دادههای معتبر باشند، و تقاضای دریافت توضیحات و سپس دادههای خام بینام را کردم. مؤسسه به ایمیل من پاسخی نداد و من هم پیگیر طرح عمومی آن موارد مشکوک نشدم.
با انتشار گزارش هر نظرسنجی، علاقمندان پرسشهای متعددی دربارۀ شیوۀ جمعآوری و تحلیل دادهها مطرح میکنند که عموماً بیپاسخ میمانند. اکنون که دوباره ماجرای نظرسنجیهای تلفنی این مؤسسه داغ شده است، موارد مشکوک آن گزارش را هم مینویسم تا به مجموعۀ پرسشهای فعلاً بیپاسخ اضافه شوند.
برای روشن شدن ناسازگاریهای آن گزارش، ابتدا یک نکتۀ آماری را با مثال توضیح میدهم.
فرض کنید از تعدادی پسر و دختر پرسیدهاید «آیا گزارۀ الف صحیح است؟» در پاسخ، درصدی از دختران (f)، درصدی از پسران (m) و درصدی از کل افراد (n) جواب مثبت دادهاند. به سادگی میتوان نشان داد که درصد کل باید بین دو مقدار درصد دختران و درصد پسرانی باشد که پاسخشان مثبت بوده است، یعنی خارج از این بازه نمیتواند باشد. یا به عبارت
ریاضی: یعنی اگر مثلاً ۱۰% از دختران و ۳۰% از پسران پاسخ مثبت داده باشند، درصد کل کسانی که پاسخ مثبت دادهاند باید بین دو رقم ۱۰ و ۳۰ باشد.
همچنین، اگر درصد کل بسیار نزدیک به یکی از دو درصد جنسیتی باشد، به معنای آن است که تعداد آن جنسیت در کل نمونه بسیار زیادتر از جنسیت دیگر بوده است. یعنی اگر مثلاً ۱۰% از دختران و ۳۰% از پسران پاسخ مثبت داده باشند و درصد کل پاسخهای مثبت هم ۱۱% باشد، میتوان نتیجه گرفت که تعداد دختران بسیار بیشتر از پسران بوده است.
اگر دستهبندی پاسخگویان شامل بیش از دو دسته باشد نیز نکات بالا صادقاند. با این مقدمه، به تعدادی از ناسازگاریهای آماری آن گزارش اشاره میکنم.
نمونۀ اول: باور به تقلب بر اساس شاخص توسعۀ انسانی محل سکونت
برای رعایت اصول حرفهای و دریافت توضیحات احتمالی، در تاریخ ۳۱ خرداد ۱۳۹۴ از طریق ایمیل به مؤسسه اطلاع دادم ناسازگاریهایی مشاهده کردهام که قصد گزارش آنها را دارم اما شاید در اثر محاسبات نادقیق روی مجموعهای از دادههای معتبر باشند، و تقاضای دریافت توضیحات و سپس دادههای خام بینام را کردم. مؤسسه به ایمیل من پاسخی نداد و من هم پیگیر طرح عمومی آن موارد مشکوک نشدم.
با انتشار گزارش هر نظرسنجی، علاقمندان پرسشهای متعددی دربارۀ شیوۀ جمعآوری و تحلیل دادهها مطرح میکنند که عموماً بیپاسخ میمانند. اکنون که دوباره ماجرای نظرسنجیهای تلفنی این مؤسسه داغ شده است، موارد مشکوک آن گزارش را هم مینویسم تا به مجموعۀ پرسشهای فعلاً بیپاسخ اضافه شوند.
برای روشن شدن ناسازگاریهای آن گزارش، ابتدا یک نکتۀ آماری را با مثال توضیح میدهم.
فرض کنید از تعدادی پسر و دختر پرسیدهاید «آیا گزارۀ الف صحیح است؟» در پاسخ، درصدی از دختران (f)، درصدی از پسران (m) و درصدی از کل افراد (n) جواب مثبت دادهاند. به سادگی میتوان نشان داد که درصد کل باید بین دو مقدار درصد دختران و درصد پسرانی باشد که پاسخشان مثبت بوده است، یعنی خارج از این بازه نمیتواند باشد. یا به عبارت
ریاضی: یعنی اگر مثلاً ۱۰% از دختران و ۳۰% از پسران پاسخ مثبت داده باشند، درصد کل کسانی که پاسخ مثبت دادهاند باید بین دو رقم ۱۰ و ۳۰ باشد.
همچنین، اگر درصد کل بسیار نزدیک به یکی از دو درصد جنسیتی باشد، به معنای آن است که تعداد آن جنسیت در کل نمونه بسیار زیادتر از جنسیت دیگر بوده است. یعنی اگر مثلاً ۱۰% از دختران و ۳۰% از پسران پاسخ مثبت داده باشند و درصد کل پاسخهای مثبت هم ۱۱% باشد، میتوان نتیجه گرفت که تعداد دختران بسیار بیشتر از پسران بوده است.
اگر دستهبندی پاسخگویان شامل بیش از دو دسته باشد نیز نکات بالا صادقاند. با این مقدمه، به تعدادی از ناسازگاریهای آماری آن گزارش اشاره میکنم.
نمونۀ اول: باور به تقلب بر اساس شاخص توسعۀ انسانی محل سکونت
منبع خبر: فردا
اخبار مرتبط: ناسازگاری آماری در نظرسنجی آیپُز
حق کپی © ۲۰۰۱-۲۰۲۴ - Sarkhat.com - درباره سرخط - آرشیو اخبار - جدول لیگ برتر ایران