https://frosthead.com

Usare la matematica per esaminare i risultati elettorali dell'Iran

Statistici e scienziati politici hanno avuto una giornata campale con i risultati delle elezioni iraniane all'inizio di questo mese. Le elezioni sono state truccate? Forse non lo sapremo mai, ma c'è abbastanza sepolto in matematica per farci pensare che avrebbe potuto essere così. Anche allora, però, c'è anche abbastanza per farci credere che tutto sia legittimo. Ecco alcune analisi che ho trovato particolarmente interessanti:

Dati puliti

Immediatamente dopo le elezioni, sono stati sollevati dubbi sulla legittimità dei dati perché ogni volta che veniva rilasciato un nuovo gruppo di risultati delle votazioni (uscivano in pezzi in Iran, simili agli Stati Uniti), la percentuale di voti è andata al presidente Mahmoud Ahmadinejad era lo stesso: 67 percento. I dati di solito non sono puliti e alcuni hanno iniziato a chiedersi se i risultati fossero stati fabbricati.

Un'analisi del professore di matematica dell'Università del Wisconsin Jordan Ellenberg in Slate, tuttavia, approfondisce i dati per dimostrare che in realtà era più disordinato di quanto ci si potesse aspettare. I risultati non sono emersi città per città, ma in grandi quantità che hanno combinato i dati provenienti da diverse aree, il che significa che i totali dei voti di Ahmadinejad erano davvero medie. E la Legge dei Grandi Numeri detta, come scrisse Ellenberg:

Medie di quantità ampiamente variabili possono e, di solito, produrre risultati che sembrano quasi perfettamente uniformi. Dati abbastanza dati, gli outlier tendono ad annullarsi a vicenda.

Ellenberg conclude che i dati sono "decisamente abbastanza disordinati da essere veri".

Legge di Benford

Diverse analisi hanno esaminato le prime cifre dei risultati delle elezioni in Iran per vedere se sono conformi alla legge di Benford, che è:

Negli elenchi di numeri provenienti da molte (ma non tutte) fonti di dati della vita reale, la cifra iniziale viene distribuita in un modo specifico e non uniforme. Secondo questa legge, la prima cifra è 1 quasi un terzo delle volte e le cifre più grandi si presentano come la cifra iniziale con frequenza inferiore e inferiore, al punto in cui 9 come prima cifra si verifica meno di una volta su venti. Questa distribuzione di prime cifre sorge logicamente ogni volta che un insieme di valori viene distribuito logaritmicamente.

Un'analisi basata su questo approccio, di Boudewijn Roukema dell'Università Nicolaus Copernicus in Polonia, ha concluso che c'erano quasi il doppio del numero di voti a partire dalla cifra 7 per Mehdi Karroubi di quanto ci si aspetterebbe dalla legge di Benford. Inoltre, Roukema sospettava che i risultati per Ahmadinejad, in cui vi erano meno 1 secondi e più 2 secondi e 3 secondi del previsto, sarebbe stato probabile che se qualcuno avesse scelto di manipolare i risultati cambiando il valore 1 all'inizio del voto è pari a 2 e 3s. Avrebbe anche portato a una sopravvalutazione dei totali di Ahmadinejad di diversi milioni di voti.

Walter Mebane, un politologo e statistico dell'Università del Michigan, ha anche usato la Legge di Benford nella sua analisi, in cui trova anche diverse irregolarità nei risultati delle elezioni in Iran. Ma anche ammette che sebbene i suoi risultati siano "compatibili con la frode diffusa", sono anche "compatibili con Ahmadinejad che ha effettivamente vinto".

Le ultime due cifre

Due studenti laureati in scienze politiche alla Columbia University hanno preso ancora una terza interpretazione dei dati. In un'analisi che hanno riassunto in un Washington Post pubblicato, hanno esaminato le ultime due cifre del conteggio dei voti da 29 province per ciascuno dei quattro candidati (ad esempio, se qualcuno ha ricevuto 14.579 voti, solo i 7 e 9 sono stati considerati in le analisi).

Le ultime due cifre nei risultati elettorali sono rumori casuali e la distribuzione delle cifre dovrebbe essere abbastanza uniforme: ogni cifra dovrebbe apparire circa il 10 percento delle volte. Gli umani, tuttavia, sono poveri generatori di numeri casuali e quando creiamo numeri, tendiamo a scegliere alcuni numeri più frequentemente di altri. Nei risultati dell'Iran, solo il 4 percento dei numeri termina nella cifra 5 mentre la cifra 7 appare il 17 percento delle volte. I risultati che deviano così tanto sarebbero attesi in circa quattro su ogni 100 elezioni.

Gli umani hanno anche problemi a creare numeri che hanno cifre non adiacenti (cioè, è meno probabile che tu ne ottenga 72 rispetto a 23), ma questi numeri dovrebbero anche seguire schemi casuali e circa il 70 percento delle coppie dovrebbe essere composto da non adiacenti cifre. Tuttavia, nei risultati dell'Iran, solo il 62 percento lo fa. Ancora una volta, questi risultati sarebbero attesi in circa 4 su 100 elezioni. Ma la combinazione dei due risultati sarebbe prevista solo in 1 ogni 200 elezioni. Improbabile, forse, ma non impossibile.

Dove ci lascia? Potremmo non sapere mai se i risultati riportati sono reali o meno. I miei dati personali preferiti da tutto ciò, tuttavia, non richiedono calcoli per portare a questioni di legittimità elettorale. Questa citazione, di Abbas-Ali Kadkhodaei, un portavoce del Consiglio dei Guardiani dell'Iran, farebbe quasi pensare a chiunque due volte:

Le statistiche fornite da Mohsen Resaei in cui afferma che oltre il 100% degli aventi diritto hanno votato in 170 città non sono accurate: l'incidente è avvenuto in sole 50 città.

(Per ulteriori informazioni sull'analisi dei risultati delle elezioni in Iran, controlla Nate Silver su fivethirtyeight.com)

Usare la matematica per esaminare i risultati elettorali dell'Iran