۱۳۸۸ خرداد ۲۹, جمعه

مطلب اول: خطي بودن رشد نسبي آرا

اولين پديده‌اي كه ترديد همه را نسبت به اعداد اعلام شده توسط وزارت كشور برانگيخت اين بود كه اعداد اعلام شده (كه بسيار سريع هم اعلام شدند) رشد آراء احمدي‌نژاد نسبت به موسوي را مطابق با يك نمودار تقريباً ايدئال خطي نشان مي‌دهند. در اين مقاله مي‌بينيم كه اين استدلال علي‌رغم انتقاد يك آماردان كماكان استدلالي قوي براي تقلبي بودن اعداد اعلام شده است.
ابتدا ببينيم منظور از خطي بودن رشد نسبي آرا چيست. نتيجه‌ي انتخابات طبق سنت هميشگي بتدريج شمارش مي‌شود و هر چند ساعت يك بار نتيجه‌ي شمارش‌هايي كه تا آن لحظه انجام شده است اعلام مي‌شود. نتيجه‌ي انتخابات روز جمعه در سيزده نوبت توسط وزارت كشور اعلام گرديد. متأسفانه در مورد آراء آقايان كروبي و رضايي رأي اعلام دوازدهم در دسترس من نيست. اعداد اعلام شده به شرح زير است:




حال فرض كنيد كه اعداد يكي از ستون‌ها (مثلاً احمدي‌نژاد) را در محور عمودي يك نمودار و اعداد ستون ديگري (مثلاً موسوي) را در محور افقي قرار دهيم. نموداري كه به دست مي‌آيد نشان‌گر اين است كه به ازاي رشد آراء احمدي‌نژاد در فاصله‌ي دو اعلام، آراء موسوي چقدر رشد كرده است. به عبارت ديگر اين نمودار نشان مي‌دهد كه در حوزه‌هايي كه بين هر دو اعلام شمارش شده‌اند محبوبيت احمدي‌نژاد و موسوي چه نسبتي با يكديگر داشته است. مثلاً اگر در اين حوزه‌ها آقاي موسوي محبوب‌تر بوده باشد نمودار بايد شيب كم‌تري پيدا كند، يعني به سمت پايين "خم شود". اگر اين نمودار هرگز به سمت پايين يا بالا خم نشود و همواره خطي باقي بماند، معنايش اين است كه محبوبيت آقاي احمدي‌نژاد و آقاي موسوي در تمامي نوبت‌هايي كه آراء شمارش شده‌اند نسبت يكساني داشته است. حال به نمودارها توجه كنيد:






مشاهده مي‌شود كه نمودارها بسيار به خط دقيق نزديك هستند. نمودار اول كه در آن اعلام‌هاي يازدهم تا سيزدهم منظور نشده‌اند بسيار خطي‌تر از نمودار دوم است كه در آن همه‌ي داده‌ها لحاظ شده‌اند. جالب توجه است كه در اعلام دهم رأي بسياري از شهرهاي بزرگ و بخشي از آراء تهران شمرده شده بود. حتي آراء اعلام شده در نوبت‌هاي يازدهم تا سيزدهم نيز خطي رشد مي‌كنند، اما شيب خط تغيير كرده است و نسبت آراء آقاي احمدي‌نژاد به آقاي موسوي از حدود دو به يك، به حدود يك به يك رسيده است. ضمناً نوبت يازدهم با فاصله‌ي زماني نسبتاً زياد از اعلام دهم و پس از گسترش خبر خطي بودن شك‌برانگيز آرا در اينترنت اعلام شد. اگر فقط ده اعلام اول را در نظر بگيريم مي‌توان گفت كه حدود هشتاد درصد آراء با روندي كاملاً خطي پيش رفته است. بايد توجه كرد كه اين هشتاد درصد به ده قسمت تقسيم شده است، يعني هربار كسر كوچكي از كل آراء شمرده شده است (بطور متوسط 8 درصد). اين امر اهميت بالايي دارد كه در زير به آن مي‌پردازيم. در روي نمودارها شاخص آر-مجذور يا همان رگرسيون نمايش داده شده است. همان‌طور كه مي‌دانيد اگر اين شاخص برابربا عدد 1 باشد، يعني اعداد دقيقاً بر روي يك خط ايدئال قرار دارند. اجازه دهيد به نمودار آراء آقاي احمدي‌نژاد نسبت به دو كانديداي ديگر نيز توجه كنيم:




همان‌طور كه مشاهده مي‌كنيد نمودار احمدي‌نژاد-كروبي رشد خطي بي‌نظيري دارد. اتفاقي كه در آزمايشگاه فيزيك نيز بندرت رخ مي‌دهد. اما نمودار احمدي‌نژاد-رضايي به اين زيبايي نيست:





البته اين كه نمودار آخر بخوبي نمودارهاي قبلي نيست چندان هم عجيب نيست. آراء آقاي رضايي در نوبت يازدهم اعلام نتايج ناگهان به مقداري كم‌تر از نوبت دهم و حتي نوبت نهم رسيد، يعني آراء ايشان به جاي زياد شدن كم شد! در مرحله‌ي بعد، يعني نوبت دوازدهم نيز، آراء ايشان اگرچه افزايش يافت اما هنوز از مرحله‌ي دهم كم‌تر بود.

اما خطي بودن آراء چه تعبيري دارد؟ همان‌طور كه در بالا گفته شد، اين خطي بودن به معناي آن است كه محبوبيت نامزدها در حوزه‌هايي كه در يك نوبت شمارش شده‌اند با بقيه‌ي حوزه‌هاي مربوط به نوبت‌هاي ديگر تفاوتي نداشته است. اين امر بسيار غيرعادي و چه بسا غيرممكن است. در تحليل اين موضوع بايد دو نكته را در نظر داشت: اولاً از آن‌جا كه چند نوبت اول شمارش آراء در فاصله‌ي يك الي دو ساعت بعد از اتمام رأي‌گيري اعلام شد (كل آرا ظرف چهار ساعت اعلام گرديد) انتظار مي‌رفت كه اين آرا مربوط به حوزه‌هاي كوچك، يعني مناطق روستايي و شهرهاي كوچك‌تر باشد، زيرا رأي‌گيري در اين مناطق زودتر به اتمام مي‌رسد و شمارش آرا بسيار زودتر تمام مي‌شود. كامران دانشجو نيز بعداً اين امر را تلويحاً تأييد كرد. اگر نوبت‌هاي اوليه بيش‌تر مربوط به مناطق روستايي و نوبت‌هاي بعدي بيش‌تر مربوط به شهرهاي بزرگ مثل تبريز، اصفهان، شيراز، مشهد، تهران و غيره بوده باشد،‌ نمودار رشد آرا به‌هيچ‌وجه نبايد خطي بماند. يك گمانه كه برخي نظرسنجي‌ها نيز تأييد كرده‌اند اين است كه آقاي احمدي‌نژاد در مناطق روستايي و شهرهاي كوچك و فقيرتر بسيار محبوب‌تر است و آقاي موسوي در شهرهاي بزرگ كه عمدتاً محل زندگي طبقه‌ي متوسط به بالا است. درنتيجه نمودار احمدي‌نژاد-موسوي بايد بتدريج به سمت پايين (شيب كم‌تر) ميل كند. حتي در سه مرحله‌ي آخر نيز اين اتفاق رخ نداد و نمودار كماكان خطي باقي ماند، اگرچه با شيب متفاوت. حتي اگر فرضيه‌ي محبوبيت روستايي احمدي‌نژاد صحيح نباشد اهميتي ندارد، حرف اين است كه محبوبيت نامزدها از نوسانات بسياري در سطح كشور برخوردار است ولي در نمودارهاي بالا چنين نوساناتي ديده نمي‌شود.

بد نيست براي مقايسه به چند نمودار مشابه براي آراء سال 84 نگاه كنيم. اين نمودارها نيز بر اساس اعلام تدريجي آراء توسط وزارت كشور در سال 84 ترسيم شده و آمار مربوطه از آرشيو سايت خبرگزاري ايسنا برداشته شده است كه نتايج را لحظه به لحظه اعلام مي‌كرده است. ريز داده‌ها در اين‌جا موجود است. (جالب است كه در سال 84 نيز 13 اعلام وجود داشته است.)









بايد توجه كرد كه اعداد سال 84 از مقادير بزرگ‌تري نسبت به سال 88 آغاز مي‌شوند و بنابراين بالا بودن رگرسيون مورد انتظار است. با اين حال ديده مي‌شود رگرسيون‌هاي به دست آمده بسيار كم‌تر از نمودارهاي سال 88 هستند. البته ممكن است براي خواننده‌ي ناآشنا با آمار، 0.899 تفاوت خيلي زيادي با 0.999 نداشته باشد، اما واقعيت اين است كه 0.899 درواقع رگرسيون بسيار پاييني است و نشان‌دهنده‌ي نوساناتي بارها بزرگ‌تر از 0.999 است. همين‌طور در مورد 0.943 يا 0.928. درواقع اين كه رقم اول رگرسيون 9 است چندان اهميتي ندارد، زيرا اعداد به‌هرحال صعودي بوده و جمع اعداد جديد با مقادير قبلي هستند. به عبارت ديگر كميت‌هاي محور افقي و عمودي متغيرهاي مستقل نيستند و بعلاوه اعداد بزرگي هستند. درنتيجه رگرسيوني مانند مقادير بالا طبيعي است. اما رگرسيون‌هاي نمودارهاي سال 88 بطرز چشمگيري به واحد نزديك‌تر هستند و نشان‌دهنده‌ي نوساناتي بارها و بارها كم‌تر (اين موضوع از نگاه كردن به خود نقاط نيز قابل درك است). نكته‌ي جالب ديگر اين كه، چنان كه از يك انتخابات طبيعي انتظار مي‌رود، رگرسيون نمودار احمدي‌نژاد-كروبي در سال 84 (به عنوان مثال) با كم و زياد كردن يكي دو نقطه‌ي نمودار بسيار تغيير مي‌كند (يعني مثلاً اگر نمودار را براي ده نقطه‌ي اول، يازده نقطه‌ي اول، ... رسم كنيم). اما رگرسيون نمودار احمدي‌نژاد-كروبي در سال 88 با هر تعداد نقطه‌ي دلخواه همان 0.999 باقي مي‌ماند.

نكته‌ي قابل توجه ديگر اين كه: نسبت آراء احمدي‌نژاد به موسوي، نسبت آراء احمدي‌نژاد به كروبي، و نسبت آراء احمدي‌نژاد به رضايي سه پديده‌ي مستقل از هم هستند. مثلاً انتظار داريم در مناطقي كه آقاي احمدي‌نژاد محبوب‌تر است آقاي رضايي نيز محبوب‌تر باشد (زيرا هر دو باصطلاح اصول‌گرا هستند). از طرفي رابطه‌ي احمدي‌نژاد-كروبي بسيار پيچيده‌تر است. برخي شعارهاي كروبي (مثل كمك مالي هفتاد هزار توماني) احتمالاً همان قشري را جذب مي‌كند كه جذب احمدي‌نژاد مي‌شوند، درحالي‌كه برخي از شعارهاي ديگر وي كاملاً در نقطه‌ي مقابل قرار دارند. بنابراين توزيع آراء اين چهار نامزد نسبت به يكديگر بايد از يك الگوي بسيار پيچيده‌تر پيروي كند. احتمال خطي بودن هر يك از اين سه پديده به‌خودي‌خود بسيار پايين است، چه رسد به اين كه اين سه پديده همزمان رخ دهند. مثلاً اجازه دهيد ببينيم براي اين كه احتمال رخ دادن همزمان سه نمودار بالا از 5 درصد بيش‌تر شود احتمال رخ دادن هريك از سه نمودار به تنهايي چقدر بايد باشد. از آن‌جا كه با سه پديده‌ي مستقل سر و كار داريم، احتمال رخ دادن هر سه بطور همزمان برابر است با حاصل‌ضرب احتمالات رخ دادن هر يك به تنهايي. پس مي‌خواهيم عددي را پيدا كنيم كه اگر سه بار در خود ضرب شود عدد 5 درصد را به ما بدهد:

x^3 = 0.05 --> x = 0.37

پس اگر احتمال رخ دادن هر يك از نمودارهاي خطي بالا 37 درصد يا بيش‌تر باشد، هر سه نمودار مي‌توانند با احتمالي بيش از 5 درصد همزمان رخ داده باشند. 37 درصد يعني اين كه از هر 5 امكان حدوداً در 2 امكان آرا دو نامزد چنين همبستگي خطي قوي‌اي را نشان دهد. در انتخابات سال 84، كه 7 نامزد و درنتيجه 6 متغير مستقل با 21 نمودار ممكن وجود داشت، در خوش‌بينانه‌ترين حالت دو تا از نمودارها (هاشمي-كروبي و هاشمي-لاريجاني) تا حدي به چنين همبستگي قوي‌اي نزديك مي‌شوند. پس واضح است كه اين پديده تا اين حد شايع نيست. بنابراين احتمال رخ دادن هر سه همبستگي خطي بطور همزمان احتمالاً كم‌تر از 5 درصد است، يعني احتمال تقلب بيش از 95 درصد است.

نكته‌ي عجيب ديگر اين است كه اگر اين نمودارها را به سمت عقب ادامه دهيم (باصطلاح "برون‌يابي" كنيم) به نقطه‌ي صفر محور مختصات نمي‌رسيم، بلكه به نقطه‌اي مي‌رسيم كه در آن احمدي‌نژاد ده‌ها هزار رأي داشته است، درحالي‌كه كانديداي ديگر هيچ رأيي نداشته است (باصطلاح نمودارها "عرض از مبدأ" دارند). اين بدان معنا است كه تا مدتي فقط احمدي‌نژاد از صندوق‌ها درآمده است. ممكن است اعتراض شود كه برون‌يابي كار صحيحي نيست. اما اگر رشد آرا (مثلاً در نمودار احمدي‌نژاد-كروبي) از ابتدا تا پايان تا اين حد خطي بوده است (با رگرسيون 0.999)، و با توجه به اين كه در نخستين نوبت اعلام تعداد آرا عدد بسيار ناچيزي است، چرا نبايد انتظار داشته باشيم كه همين روند خطي تا لحظاتي قبل نيز ادامه داشته است؟ اين انتظار معقول به يك نتيجه‌ي نامعقول مي‌رسد: تا حدود چند هزار رأي اول هيچ اسمي به جز احمدي‌نژاد از صندوق‌ها بيرون نيامده است.

نيت سيلور آماردان آمريكايي در وبلاگ خود به استدلال بالا، يعني استدلال خطي بودن رشد آرا به منظور اثبات تقلب انتقاد كرده است. بسياري ممكن است به اين مقاله ارجاع دهند تا ثابت كنند كه خطي بودن رشد آرا دليل تقلب نيست. اما درواقع مقاله‌ي آقاي سيلور نه تنها اين نتيجه را در بر ندارد، بلكه تأييد محكم‌تري است بر نامحتمل بودن اين پديده. ابتدا اجازه دهيد مقاله‌ي ايشان را مرور كنيم و سپس به تحليل آن بپردازيم. نيت سيلور در مقاله‌اي كه لينك آن داده شد، بر اساس داده‌هاي آخرين انتخابات رياست‌جمهوري ايالات متحده‌ي آمريكا (كه اوباما پيروز آن بود)، اما با فرض يك وضعيت خيالي در مورد نحوه‌ي اعلام آرا، نموداري تهيه كرده است كه به اندازه‌ي نمودار احمدي‌نژاد-موسوي (بالا) خطي است. در تهيه‌ي اين نمودار فرض‌هاي زير شده است.

-فرض كنيد كه نتيجه‌ي آراء مردم در ايالات متحده در شش نوبت اعلام شود.

-فرض كنيد كه در هر نوبت مجموع آراء تعدادي از ايالت‌ها اعلام شود. ايالت‌ها بر اساس ترتيب حروف الفبا در اين شش نوبت مرتب شده‌اند.

-در نوبت اول از ايالت آلاباما تا ايالت ايلينويز گنجانده شده است كه حدود ثلث كل آرا را در برمي‌گيرد.

حال اگر يك نمودار اوباما-مك‌كين براساس اين شش مرحله‌ي اعلام آرا رسم شود به اندازه‌ي نمودار احمدي‌نژاد-موسوي خطي خواهد بود (با رگرسيون مشابه). با فرض اين كه در انتخابات ايالات متحده تقلب وسيعي صورت نگرفته است نتيجه مي‌شود كه خطي بودن دليل تقلب نيست.

تصور مي‌كنم كه مقاله‌ي آقاي سيلور اتفاقاً برعكس اين نتيجه را به دست مي‌دهد. هر سه فرض فوق‌الذكر اشكالات اساسي براي استدلال ايشان ايجاد كرده و قياس آن با انتخابات اخير ايران را قياس مع‌الفارق مي‌كند. اولاً جمعيت ايالات متحده سه برابر ايران است و تعداد آراء اعلام شده در اين مطالعه (حدود 129 ميليون) حدود 3.2 برابر آراء انتخابات اخير ايران (حدود 39 ميليون) است. آقاي سيلور آرايي معادل با سه برابر تعداد آراء ايران را در شش نوبت، يعني نصف تعداد نوبت‌هايي كه آرا ايران اعلام شد گنجانيده است. مسلم است كه گنجانيدن حجم بيش‌تري از آرا در تعداد كم‌تري از نوبت‌ها منجر به كم شدن پراكندگي و افزايش رگرسيون مي‌شود. براي يك تحليل درست بايد آراء ايالات متحده به حدود 39 قسمت (سه برابر 13) تقسيم مي‌شد تا اثر تفاوت جمعيت خنثي شود.

فرض دوم نيز وضع بهتري ندارد. جمع زدن آراء چند ايالت كه حرف اول اسم‌شان در حروف الفبا به هم نزديك است يعني ايجاد يك نمونه‌ي آماري تصادفي (رندم) يا به اصطلاح "همگن‌سازي" نمونه‌ي آماري. در يك نمونه‌ي همگن البته اجزا نماينده‌ي كل هستند و طبيعي است كه تفاوت چنداني ميان شش نوبت اعلام آرا نباشد. در هر نوبت اعلام آرا، آراء چند ايالت جمهوري‌خواه با آراء چند ايالت دموكرات تركيب شده است، بطوري كه نسبت آراء دموكرات‌ها به جمهوري‌خواهان تقريباً ثابت مانده است. تمام نكته‌ي نمودارهاي مربوط به انتخابات 22 خرداد اين است كه اين سيزده نوبت اعلام آرا تركيبي از آراء نقاط مختلف كشور بصورت تصادفي نبوده‌اند، بلكه به ترتيب شمارش اعلام شده‌اند كه اصولاً از روستاها و شهرهاي كوچك آغاز و سپس به شهرهاي بزرگ‌تر مي‌رسد. استان‌هايي كه در نوبت‌هاي اوليه اعلام مي‌شوند لزوماً جو سياسي و فرهنگي مشابهي با استان‌هايي كه در نوبت‌هاي بعد اعلام مي‌شوند ندارند.

فرض سوم نيز مشكل‌ساز است. 33 درصد آرا در يك نوبت (نوبت اول) گنجانده شده است. اين امر وضعيت نوبت اول را از نوبت‌هاي بعدي (كه حداكثر 19 درصد آرا را دربرمي‌گيرند) متفاوت مي‌كند. در انتخابات ايران چنين وضعيتي برقرار نبود و در هر نوبت كسر تقريباً يكساني از آرا اعلام مي‌شد. بعلاوه اين كسر بطور متوسط 8 درصد آرا را دربرمي‌گرفت. در تكه‌هاي 8 درصدي داده‌ها احتمال واريانس بالا بسيار بيش‌تر از يك تكه‌ي 33 درصدي است. به بيان ديگر وقتي 8 درصد آرا در يك نوبت اعلام مي‌شود معنايش اين است كه فقط آراء يك، دو يا سه شهرستان ايران اعلام شده است (در حالي كه 33 درصد آراء ايالات متحده يعني آراء مربوط به حدود پانزده ايالت). نوسانات جو سياسي از يك شهرستان به شهرستان ديگر ايران آن‌قدر زياد هست كه انتظار نوسانات بسياري را در نمودار داشته باشيم.

در كامنت‌هايي كه در زير مقاله‌ي آقاي سيلور ديده مي‌شود مشابه اين انتقادات بسيار مطرح شده است و به نظر مي‌رسد اكثريت مطالعه‌كنندگان ايشان (كه بسياري از ايشان خود آماردان هستند) قبول دارند كه تحليل ايشان نتيجه‌اي كه مدنظر بوده است را نمي‌دهد.

اما تحليل آقاي سيلور يك نكته‌ي جالب به ما مي‌آموزد: براي ايجاد يك چنين نمودار خطي با چنين رگرسيوني بايد شرايط بسيار خاصي فراهم باشد: بايد آراء بسياري از نقاط كشور با گرايش‌هاي سياسي مختلف بطرز كاملاً همگني با هم تركيب شده باشند و در تكه‌هاي بزرگ اعلام شوند. اين نكته بار ديگر نشان مي‌دهد كه احتمال چنين اتفاقي تا چه اندازه پايين است.

در پايان لازم به ذكر است كه خطي بودن رشد آرا را مي‌توان صرفاً با نگاه به آمار اعلام شده‌ي وزارت كشور از آرا به تفكيك شهرستان نيز دريافت. يك نگاه به اين آمار نشان مي‌دهد كه نوسانات آراء احمدي‌نژاد چقدر كوچك است. براي روشن شدن اين نكته مي‌توان از شاخص انحراف معيار بر ميانگين استفاده كرد كه نشان مي‌دهد نوسانات آرا از استان به استان نسبت به رأي كلي هر كانديدا چقدر است. اما چرا از انحراف معيار بر ميانگين استفاده كنيم و نه انحراف معيار؟ استفاده از اين شاخص به اين ترتيب توجيه مي‌شود: فرض كنيد كه كانديدايي در استان الف به اندازه‌ي x و در استان ب به اندازه‌ي 2x احتمال رأي آوردن (يا همان "محبوبيت") داشته باشد. حال دو وضعيت را با هم مقايسه مي‌كنيم: يكي وقتي كه a نفر در هر استان رأي داده‌اند و يكي وقتي كه 2a رأي داده‌اند. در وضعيت اول فاصله‌ي عددي آراء او در استان ب از آراء وي در استان الف برابر است با ax، درحالي‌كه در وضعيت دوم اين فاصله برابر است با 3ax، يعني سه برابر. اين صرفاً بياني پيچيده از اين واقعيت ساده است كه با افزايش آراء يك نامزد (يا هر كميت ديگر) انتظار مي‌رود نوسانات آراء وي از استان به استان (يا نوسانات مقدار كميت از اندازه‌گيري به اندازه‌گيري) نيز چشمگيرتر شود. حال به جدول زير كه مقايسه‌ي انحراف معيار بر ميانگين آراء چند نامزد در انتخابات سال 84 و سال 88 است نگاه كنيد:



(جزييات داده‌ها در اين‌جا قابل مشاهده است.) توضيح: در مورد اعداد بسيار كوچك و نزديك به صفر مثل آراء آقايان كروبي و رضايي در سال 88 و آقايان لاريجاني و قاليباف در سال 84 اين شاخص موضوعيت ندارد و چيزي را نشان نمي‌دهد، در نتيجه از آوردن آن خودداري كرديم. همان‌طور كه مشاهده مي‌شود انحراف معيار بر ميانگين آراء هر پنج نامزد سال 84 از انحراف معيار بر ميانگين آراء آقاي احمدي‌نژاد در سال 88 به مراتب بزرگ‌تر است. به عبارت ديگر نوسانات آراء اين نامزدها از استان به استان چندين برابر نوسانات آراء احمدي‌نژاد در سال 88 بوده است. شاخص مربوطه در مورد آقاي هاشمي وضعيت جالبي دارد. گويا در مورد نامزدهايي مثل آقاي هاشمي كه در گذشته داراي مناسب سياسي گوناگون از جمله رياست‌جمهوري بوده و در سراسر ايران شهرت كم‌نظير دارد اين نوسانات آرا بسيار كم‌تر از نامزدهاي ديگر است. بااين‌حال اين شاخص در مورد هاشمي هنوز عددي حدود دو برابر احمدي‌نژاد را نشان مي‌دهد. در عوض انحراف معيار بر ميانگين آراء موسوي در سال 88 شبيه به هاشمي در سال 84 است، با اين كه موسوي براي نسل جوان‌تر به اندازه‌ي هاشمي شناخته شده نيست و از اعتبار يكنواختي برخوردار نيست. پس خطي بودن آرا را مي‌توان بدون استفاده از مرحله‌هاي مختلف اعلام نتايج و صرفاً با استفاده از ريز داده‌هاي وزارت كشور نيز بيان كرد.

وزارت كشور در نامه‌اي در پاسخ به موسوي به ادعاي ثابت بودن نسبت آرا در سطح كشور اين‌گونه پاسخ مي‌دهد: "توجه ايشان را به اين نكته معطوف مي‌داريم كه آراء كانديداها در مناطق كشور ثابت نبوده و به عنوان مثال خود ايشان در رتبه بندي آراء در استانهاي آذربايجان غربي و سيستان و بلوچستان نفر اول هستند". اين پاسخ بوضوح نكته‌ي اصلي بحث را ناديده مي‌گيرد: در تحليل آماري مسأله بر سر اين نيست كه نسبت آرا دقيقاً يكسان است (كه اگر بود ديگر در تقلب ترديدي وجود نداشت)، البته كه نسبت‌ها دقيقاً ثابت نيست، نكته اين است كه نوسانات اين نسبت‌ها آن‌قدر اندك است كه بلحاظ آماري احتمال رخ دادن خودبه‌خودي آن ناچيز است. منظور از ثابت بودن كم بودن غيرعادي انحراف معيار بر ميانگين است.

نتيجه‌گيري: خطي بودن رشد آرا بطور همزمان براي هر سه نمودار ممكن بسيار بعيد است و هنوز آمارداني موفق نشده است اين پديده را با فرضيه‌اي غير از تقلب توضيح دهد. مشابه همين ادعا را مي‌توان در مورد انحراف معيار بر ميانگين آراء نامزدها نمود كه بطور غيرعادي پايين است. ناهنجاري‌هاي ديگري نظير كم شدن ناگهاني آراء رضايي در مرحله‌ي دهم و وجود عرض از مبدأ نيز قابل تعمق و پيگيري هستند.

۲ نظر:

  1. سلام
    تا حالا برنامه نود رو ديديد. وقتي 3 ميليون نفر در يك نظر سنجي شركت مي كنند در 15 دقيقه اول آمار ها نمايي زياد مي شود ولي بعد تقريبا درصد نظرات ثابت مي ماند.
    ما با استدلال بالا اساس علم آمار رو زير سوال برديم.در علم آمار ما يك جامعه تقريبا كامل و كوچك رو در نظر مي گيرم براي مثال 1 ميليون سلول و بعد روابط آنها(يك پارامتر خاص) را به دست مي اوريم و اين رو به كل سلول ها بسط مي دهيم زيرا به صورت تقريبا خطي با افزايش تعداد اين پارامتر افزايش مي يابد. مثلا در نظر سنجي ها هم اين اصل استوار است. يك جامعه كوچك رو درنظر مي گيرم و بعد آن را به كل جامعه بسط مي دهيم.

    پاسخحذف
  2. اعترافات مهندس نمكيان دبير كل حركت حزب ا… و از موسسين احياي حزب ا… كه بعد فرار از ايران و پناهنده شدن به سازمان ملل قسمتي از فيلم آن منتشر مي شود. (بخش اول : پیش بینی های ایلیا درباره آینده، و تحریفهای اِبا (اداره برخورد با ادیان) )فایل تصویری گفتگوی خانم دكتر پریس كي نژاد (عضو مرکزی و سخنگوی حامیان ایلیا میم در خارج از کشور) در پاسخ به به اتهامات دروغ دايره مذاهب (مجموعه فیلم های سراب زدا در 3 بخش)
    جهت دانلود فیلم ها و ارسال آن به سایرین:
    www.sarab-zoda.blogfa.com
    www.Efshagarane-eba.blogfa.com

    پاسخحذف