סטטיסטיקאים ומדענים פוליטיים עברו יום שדה עם תוצאות הבחירות באיראן בתחילת החודש. האם הבחירות נוקשה? אנו לעולם לא נדע, אבל יש מספיק קבורים במתמטיקה כדי לגרום לנו לחשוב שאולי זה היה כך. גם אז יש מספיק כדי לגרום לנו להאמין שהכל לגיטימי. להלן מספר ניתוחים שמצאתי מעניינים במיוחד:
נתונים נקיים
מיד לאחר הבחירות הועלו ספקות לגבי הלגיטימיות של הנתונים מכיוון שבכל פעם שפורסמה קבוצה חדשה של תוצאות הצבעה (הם יוצאים בחלקים באיראן, בדומה לארצות הברית), אחוז הקולות שהגיע לנשיא מחמוד אחמדינג'אד. זהה: 67 אחוז. נתונים בדרך כלל אינם נקיים, וחלקם התחילו לתהות אם התוצאות היו מפוברקות.
עם זאת, ניתוח שפרופסור המתמטיקה מאוניברסיטת וויסקונסין, ג'ורדן אלנברג ב- Slate, מעמיק בנתונים כדי להראות שהם למעשה יותר מסוכנים ממה שניתן היה לצפות. התוצאות לא יצאו עיר אחר עיר אלא בקבוצות גדולות ששילבו נתונים מכמה אזורים, מה שאומר שסכומי ההצבעה של אחמדינג'אד היו באמת ממוצעים. וחוק המספרים הגדולים מכתיב, כמו שכתב אלנברג:
ממוצעים של כמויות שונות משתנים יכולים בדרך כלל להניב תוצאות שנראות אחידות כמעט לחלוטין. בהינתן מספיק נתונים, הממציאים נוטים לבטל זה את זה.
אלנברג מסיקה כי הנתונים "בהחלט מבולגנים מספיק כדי להיות אמיתיים."
חוק בנפורד
מספר ניתוחים בדקו את הספרות הראשונות של תוצאות הבחירות באיראן כדי לבדוק אם הם עומדים בחוק של בנפורד, שהוא:
ברשימות של מספרים ממקורות נתונים רבים (אך לא כולם) מהחיים האמיתיים, הספרה המובילה מופצת באופן ספציפי ולא אחיד. על פי חוק זה, הספרה הראשונה היא 1 כמעט שליש מהזמן, וספרות גדולות יותר מתרחשות כספרה המובילה עם תדר נמוך ותחתון, עד לנקודה שבה 9 כספרה ראשונה מתרחשת פחות מפעם אחת בעשרים. התפלגות ספרות ראשונה זו מתעוררת באופן הגיוני בכל פעם שקבוצת ערכים מופצת לוגריתמית.
ניתוח אחד שנעשה באמצעות מנגנון זה, מאת בודווין רוקמה מאוניברסיטת ניקולאוס קופרניקוס בפולין, הגיע למסקנה כי יש כמעט פי שניים ספירת הצבעות המתחילות בספרה 7 עבור מהדי קרובי מה שהיה צפוי בחוק של בנפורד. בנוסף, קוקמה חשד כי התוצאות עבור אחמדינג'אד, בהן היו פחות 1 ויותר 2 ו -3 ו -3 מהצפוי, היו סבירות אם מישהו יבחר לתפעל את התוצאות על ידי שינוי ה- 1 בתחילת ההצבעה מסתכם ל -2 ו 3s. זה גם היה מביא להערכת יתר של סך כל אחמדינג'אד בכמה מיליוני קולות.
וולטר מביין, מדען פוליטיקאי וסטטיסטיקאי מאוניברסיטת מישיגן, השתמש גם בחוק של בנפורד בניתוחו, בו הוא מוצא גם כמה חריגות בתוצאות הבחירות באיראן. אבל אפילו הוא מודה כי למרות שהתוצאות שלו "תואמות הונאה רחבה", הן גם "תואמות את זה שאחמדינג'אד ניצח בפועל."
שתי הספרות האחרונות
שני סטודנטים לתארים מתקדמים במדעי המדינה באוניברסיטת קולומביה קיבלו נתונים שלישיים. בניתוח שסיכמו בעיתון וושינגטון פוסט, הם בדקו את שתי הספרות האחרונות של ספירת ההצבעות מ- 29 מחוזות עבור כל אחד מארבעת המועמדים (למשל, אם מישהו קיבל 14, 579 קולות, רק 7 ו -9 נלקחו בחשבון ב הניתוח).
שתי הספרות האחרונות בתוצאות הבחירות הן רעש אקראי, והתפלגות הספרות צריכה להיות יחסית אחידה - כל ספרה צריכה להופיע בערך 10 אחוז מהזמן. בני אדם, לעומת זאת, הם מחוללי מספרים אקראיים ירודים וכאשר אנו ממציאים מספרים אנו נוטים לבחור מספרים בתדירות גבוהה יותר מאחרים. בתוצאות איראן, רק 4 אחוז מהמספרים מסתיימים בספרה 5 ואילו הספרה 7 מופיעה 17 אחוז מהזמן. תוצאות החורגות מכך הרבה צפויות בכארבע מכל מאה בחירות.
לבני אדם יש גם בעיות ביצירת מספרים שיש להם ספרות לא צמודות (כלומר, יש סיכוי נמוך יותר שתעלה 72 מאשר עם 23), אך מספרים אלה צריכים גם לעקוב אחר דפוסים אקראיים וכ -70 אחוז מהזוגות צריכים להיות מורכבים מאנשים שאינם סמוכים ספרות. עם זאת, בתוצאות איראן רק 62 אחוזים עושים זאת. שוב, תוצאות אלה היו צפויות בכ -4 מתוך כל 100 בחירות. אבל השילוב של שתי התוצאות היה צפוי רק ב -1 מכל 200 בחירות. בלתי אפשרי, אולי, אך לא בלתי אפשרי.
איפה זה משאיר אותנו? לעולם לא נדע אם התוצאות המדווחות אמיתיות או לא. עם זאת, הנתונים הקטנים המועדפים עלי מכל זה אינם מצריכים חישובים שיובילו לשאלות של לגיטימציה לבחירות. הציטוט הזה, מאת עבאס-עלי קדחודאי, דובר מועצת המפקחים של איראן, יגרום כמעט לכל אחד לחשוב פעמיים:
הנתונים הסטטיסטיים שנמסרו על ידי Mohsen Resaei בהם הוא טוען כי למעלה מ- 100% מהזכאים הטילו את הצבעה ב -170 ערים אינם מדויקים - האירוע התרחש רק ב -50 ערים.
(למידע נוסף על ניתוח תוצאות התוצאות בבחירות באיראן, בדוק את נאט סילבר באתר fivethirtyeight.com)