Noi di...
Gennaio- Febbraio 2010 - ANN0 VIII nn. 1-2
pagina iniziale articolo successivo
|
I numeri nei millenni
|
V |
||
|
di Stefano Breccia
* *
*
I
numeri nella storia dell’umanità la cultura dei numeri
___________
Approfondimenti 6
|
|||
|
Statistica, probabilità e
affini
È assai diffusa l’opinione che le statistiche siano da
prendersi con le molle. Come ebbe a dire Benjamin Disraeli:
e ciò parrebbe confermato dalla
simpatica foto (tratta dal gradevole libro di De Crescenzo, “La
Napoli di Bellavista”).
Pur
senza giungere a tanto, va comunque fatto presente che, anche se le
statistiche non mentono (ammesso che i dati su cui si basano siano
reali!), da un lato è abbastanza facile piegarle a sostenere una qualunque
opinione (come appare nella foto), dall’altro è analogamente facile, pure
se gli effetti sono ben più insidiosi, prendere lucciole per lanterne in
perfetta buona fede. Esistono difatti proprietà non molto conosciute dai
non addetti ai lavori, per effetto delle quali può accadere che la natura
del fenomeno in esame, così come presentata da una statistica, sia
contraria a quello che il buon senso pare suggerire. Si parla in questi
casi di paradossi, anche se il termine è improprio, in quanto l’errore è
nella mente di chi giunge a false conclusioni. Iniziamo con un esempio particolarmente semplice.
Immaginiamo che un signore voglia acquistare un prodotto, e conduca una
piccola ricerca di mercato al fine di determinare che cosa, fra quanto
offre il mercato, meglio risponda a due requisiti ritenuti importanti. Per
fissare le idee, pensiamo che l’oggetto in questione sia un’automobile, ed
il futuro acquirente ne voglia comprare una che al meglio soddisfi le
caratteristiche di essere comoda ed economica. Il nostro (semplifichiamo) decide di scegliere fra i
costruttori americani e quelli europei; esamina quindi cinque macchine
prodotte negli USA, e cinque prodotte nel vecchio continente, assegnando a
ciascuna un voto lapidario (+, -) in relazione ai due requisiti
prefissati, giungendo a stilare la seguente tabella:
com. ec.
com.
ec.
amer.1
+
+
eur.1
+
+
amer.2
-
+
eur.2
-
-
amer.3
-
+
eur.3
+
+
amer.4
+
-
eur.4
-
-
amer.5
+
-
eur.5 -
-
Le macchine americane hanno tre + in entrambe le
colonne, contro quelle europee che ne hanno solo due; parrebbe quindi
ovvio che la scelta debba cadere sui costruttori d’oltre oceano. In realtà
le cose stanno esattamente al contrario, in quanto, fra le dieci vetture
esaminate, due europee e solo una americana hanno riportato un + in
entrambe le colonne, quindi la probabilità di trovare una buona macchina
americana è del 20%, contro il 40% (esattamente il doppio!) di trovarne
una buona in Europa. Il secondo esempio, appena un poco più complesso, è un
caso di quello che è noto come “Paradosso di Simpson” (dal nome dello
statistico inglese che ne ha scritto nel 1951); seguendo l’articolo di
Simpson, immaginiamo che due dottori vogliano verificare l’ipotesi secondo
la quale un certo farmaco sia più vantaggioso sugli uomini che sulle
donne. I due quindi conducono separatamente un lungo periodo di
esperimenti, ed alla fine scrivono un dotto articolo congiunto, nel quale
affermano di ritenere di aver potuto verificare l’ipotesi di partenza. Le loro affermazioni si basano sulla seguente tabella
riepilogativa:
dottore A
dottore B
uomini
donne
uomini
donne utile
300 (43%)
100 (33%)
400 (67%)
700 (64%) inutile
400 (57%)
200 (67%)
200 (33%)
400
(36%) Il dottor A ha difatti rilevato come la cura risulti
utile sul 43% di pazienti maschi, contro solo il 33% di donne; il dottor B
ha risultati un poco più modesti, in quanto il farmaco ha giovato al 67%
di maschi contro il 64% di donne. In entrambi i casi, comunque, gli uomini
che hanno tratto giovamento dalla cura sono risultati in percentuale
maggiore rispetto alle donne, e ciò ha confortato i due medici a ritenere
confermata l’ipotesi iniziale. È invece evidente (anche se non plateale) che i dati
sperimentali sono leggermente contrari a tale ipotesi; se difatti si tiene
conto di tutto l’universo delle cavie (pare che purtroppo molto spesso
persone che si ritengono pazienti sono invece delle cavie a loro
insaputa!), si ha la seguente tabella:
uomini
donne
utile
700
(54%)
800 (57%)
inutile
600
(46%)
600 (43%) Va notato che, con gli stessi dati iniziali, si
sarebbe potuta stilare ancora un’altra tabella (che qui presentiamo con le
sole percentuali, in quanto i dati numerici assoluti sono gli stessi). In
questa tabella, per ogni dottore, e per il totale dell’universo, si
calcolano le percentuali fra maschi e femmine nei due casi separati di
successo e di fallimento della cura:
dr. A
dr. B
totale
(M) (F)
(M)
(F)
(M)
(F)
utile
75%
25%
36%
64%
47%
53%
inutile 67%
33%
33%
67%
50%
50% Facendo i conti in questo modo, è evidente che i dati
ottenuti dal dottor A contraddicono sempre i corrispondenti risultati del
dottor B: nel caso di successo, per A gli uomini sono stati il 75% del
totale, mentre per B sono le donne ad avere la maggioranza, con il 64%; un
particolare che avrebbe dovuto far pensare i nostri clinici è che, per
entrambi i dottori, la maggioranza corrisponde allo stesso sesso sia in
caso di successo che di fallimento! Per il dottor A, ad esempio, gli
uomini sono stati il 75% fra quanti hanno tratto beneficio dalla cura, ma
anche il 67% (ancora la maggioranza) fra quanti non ne hanno tratto alcun
vantaggio. Per il dottor B si ha ancora un fenomeno analogo, con la
differenza che adesso sono le donne ad essere in predominio. Anche in
questo caso, comunque, le percentuali riassuntive rendono giustizia al
fatto che, globalmente, sono state le donne ad avere un sia pur modesto
predominio (53% verso 47%) fra quanti hanno tratto giovamento, mentre sono
in parità fra gli altri. Un eventuale giudizio conclusivo sull’ipotesi di
partenza è evidentemente che essa è priva di fondamento; attenzione, però,
in quanto il sostenere vera l’ipotesi opposta (il farmaco giova più alle
donne che agli uomini), quand’anche effettivamente supportata dai dati, ha
una preponderanza troppo piccola per poter essere significativa. Pertanto
si può concludere che è sbagliato ritenere che esista una risposta
differenziata per sesso all’uso di quel particolare farmaco. Come si vede, quindi, usando gli stessi dati è stato
possibile sostenere sia un’ipotesi che il suo contrario, mentre la verità
è che la domanda è stata mal posta, e, più importante ancora, che il
campione sperimentale coinvolto non è stato scelto con oculatezza. Il paradosso di Simpson è stato riscoperto più volte
in episodi reali, spesso allorché si presentavano, a sostegno di una tesi,
casi favorevoli tratti da ambiti indipendenti fra di loro, con numerosità
sensibilmente diverse. È rimasto famoso uno studio, condotto negli States
allorché si iniziava a tentare di contrastare presunte disparità di
trattamento, prima fra i due sessi (agli albori del femminismo), poi fra i
WASP (White, Anglo-Saxon, Protestant) e le cosiddette minoranze. È
risultato (Bickel et alii, Op.
cit.) che, contro tutte le apparenze,
all’università di Berkeley, in California, erano proprio gli studenti
maschi e WASP ad essere trattati leggermente peggio degli altri. Con eguale logica (!) si è sostenuto ad esempio che
negli Stati Uniti i tassisti sono per la maggioranza di origine russa, dal
che, in nome di una ipotetica equa distribuzione dei conducenti di auto
pubbliche nel mondo, dovrebbe discendere il fatto che in Russia la
maggioranza dei tassisti sia di origine americana! Un altro esempio (tipico delle cronache politiche
italiche) si trova spesso nei commenti ai risultati elettorali (cfr. foto
di cui sopra). Immaginiamo che ci siano tre partiti (A, B e C) che
concorrono in tre provincie del nord (P1, P2 e P3) ed in tre provincie del
sud (P4, P5 e P6), e che i risultati finali siano:
P1
P2 P3
P4 P5
P6
totali
A 51
17 15
14 40
20
157
B 44
15
14
12
50 25
160
C 10
9
8
13
70 30
140 eletto A
A
A
A
C C Fra i commenti non si mancherà certo di sottolineare
il fatto che A abbia vinto nel 67% dei casi, mentre C ha vinto nel 67% dei
casi nel sud; inoltre B non ha mai vinto, pur avendo avuto
complessivamente la maggioranza dei voti; nella provincia P5 (quella più
numerosa) C ha sfiorato la maggioranza assoluta, essendosi attestato al
44%, mentre in P1 (seconda per numerosità) è stato A a sfiorare la
maggioranza con il 49%, eccetera, eccetera, pietosamente eccetera; già con
tre partiti e sei provincie si potrebbe parlare per diverse pagine;
figurarsi che cosa accade quando entrambi questi numeri aumentano a
dismisura; d’altronde la domanda precedente è purtroppo retorica, in
quanto periodicamente assistiamo ad esplosioni di commenti a valle
dell’ennesima tornata elettorale! È vero che il meccanismo elettorale è prono di per sè
a situazioni paradossali, proprio per il modo con cui vengono condotte le
elezioni; nel 1980 il prof. Davis Morton, del City College di New York,
tentò (Op. cit.) di formalizzare in cinque punti le regole cui dovrebbe
aderire una tornata elettorale al fine di evitare esiti paradossali, ma la
conseguenza, a sua volta paradossale, è che non può esistere alcun
meccanismo elettorale che possa adeguarvisi! Tanto vale quindi mettersi
l’animo in pace ... Passiamo ad altro. Un gioco d’azzardo (fortunatamente
poco diffuso) negli States si basa su tre cartoncini: uno ha le facce
entrambe rosse, il secondo entrambe bianche, il terzo ha una faccia rossa
e l’altra bianca; ogni carta è chiusa entro un involucro separato, e
opaco. Dopo aver mescolato, il croupier estrae una carta e la poggia sul
tavolo, usando tutta la cautela possibile affinché la faccia nascosta
resti invisibile; immaginiamo che la faccia scoperta sia rossa; a questo
punto il nostro propone all’incauto astante di accettare una scommessa
alla pari che la faccia nascosta sia anch’essa rossa; in effetti,
arguisce, questa faccia può solo essere bianca o rossa, quindi le
probabilità sono entrambe del 50%. È intuibile che non convenga accettare,
ma perché? Ripensandoci un attimo, è evidente che ci sono tre facce rosse
nel mazzo, ma a due di esse corrisponde una faccia di uguale colore. Il
croupier ha quindi due probabilità su tre di vincere la scommessa. Un altro gioco “per gonzi” è il
Bird Cage (anche Chuck-a-luck),
discretamente diffuso negli USA: il giocatore punta una somma su un numero
(fra uno e sei), ed il croupier lancia tre dadi; se il numero puntato esce
una volta, il giocatore ha una vincita netta pari alla somma (riceve
indietro, cioè, il
doppio di quanto aveva puntato);
la vincita
sale a due volte la posta se il
numero compare due volte, a tre volte la posta se tutti e tre i dadi si
fermano sul numero puntato. Ci si aspetta che il gonzo in questione ragioni, più o
meno, così: la probabilità che il numero esca su un dado è di 1/6, quindi
su tre dadi è di 1/2, e quindi il gioco è alla pari nel caso di una sola
uscita; dato però che può darsi che il numero esca anche due o tre volte,
queste sono tutte probabilità a favore dello scommettitore, per cui il
gioco è a vantaggio di quest’ultimo. Naturalmente la diffusione del
Bird Cage dovrebbe da sola dimostrare l’erroneità di questo
ragionamento, ma, contemporaneamente, sottolinea la quantità di gente che
vi cade! Un ulteriore esempio (proposto nel 1713 da Niklaus
Bernoulli) coinvolge due giocatori, diciamo A e B, ed una moneta; A
inizia il gioco consegnando a B una somma
S di denaro. B lancia la moneta;
se esce testa, B paga ad A un’unità (diciamo un dollaro) ed il gioco
termina; altrimenti B lancia ancora la moneta; se esce testa al secondo
lancio, B paga ad A due dollari, altrimenti prosegue; se esce testa al
terzo lancio, paga 4 dollari, e così via. In definitiva, B continua a lanciare la moneta
fintanto che ottiene croce; se esce testa all’n-esimo lancio, B paga ad A una somma pari a 2n dollari.
Il problema consiste nel determinare quanto debba valere la somma iniziale
S affinchè il gioco sia equo. L’imprevista risposta è che la somma iniziale deve
essere infinita affinché il gioco sia equo; per un qualunque valore finito
di S, A si trova leggermente in
vantaggio. Vale la pena di ricordare che il problema, sebbene
corretto da un punto di vista formale, non lo è affatto in termini
concreti; perché, difatti, la risposta di Bernoulli fosse ammissibile,
sarebbe necessario poter disporre di un tempo di gioco infinito, e,
ovviamente, di somme di denaro infinite; sarebbe interessante provare a
rifare i calcoli prevedendo un numero massimo di lanci, od un valore
massimo ammesso per vincite e perdite. Per inciso, questa è la
constatazione che sfugge a quanti si illudono di vincere ad un qualunque
gioco utilizzando un sistema che consiste nell’incrementare la posta dopo
ogni sconfitta: quand’anche esistessero sistemi vincenti del genere (e
sono purtroppo assai rari!) esiste sempre la possibilità che il giocatore
debba arrestarsi per avere dato fondo alle sue risorse prima di
raggiungere l’ipotetico colpo fortunato. Pensiamo di giocare al
Rouge et Noir alla roulette: la probabilità che esca un numero rosso
è 1/2 (in realtà 18/37, a causa della presenza dello zero, che altera le
probabilità in favore del casinò, ma dimentichiamoci dello zero per fare i
conti tondi). Se io punto una somma
S sul rosso, ed esce nero, ho evidentemente perso
S. Potrei sperare di rifarmi puntando ancora
S, magari (ma questo è inessenziale) ancora sul rosso: se difatti
vincessi, tornerei in pari. Alla seconda sconfitta, devo ora puntare 2·S
se voglio sperare di rifarmi, con un’eventuale vincita, delle perdite sin
qui sostenute. Se vinco, tutto va bene, ma in caso contrario dovrò puntare
4·S, e così via. Naturalmente, prima o poi, dovrò pur vincere, per cui
questo banale meccanismo (ovviamente semplificato in quanto non tiene
conto dello zero, e non prevede nessun guadagno finale) mi “assicura” che
prima o poi uscirò dalla casa da gioco con esattamente tanti soldi quanti
ne avevo all’ingresso, ammesso però che io sia capace di sostenere le
successive scommesse sufficientemente a lungo. È difatti evidente che il
totale delle somme investite sale assai rapidamente. Una leggera variante
di questo metodo, che assicura (per modo di dire) una effettiva vincita
positiva; viene detta “martingala”. A puro titolo di esempio, la tabella successiva mostra
come si incrementa l’investimento generale, pensando di scommettere a
Rouge et Noir, tenendo conto
della presenza dello zero, e mirando ad un guadagno utile del 10% al primo
successo:
1
Punt.
1.000
perso
1.000
2
Punt.
1.100
perso
2.100
3
Punt.
2.310
perso
4.410
4
Punt.
4.851
perso
9.261
5
Punt
10.187
perso
19.448
6
Punt.
21.393
perso
40.841
7
Punt.
44.925
perso
85.766
8
Punt.
94.343
perso
180.109
9
Punt.
198.120
perso
378.229
10
Punt.
416.052
perso
794.280
11
Punt.
873.708
perso
1667.988 Se dopo dieci estrazioni non ho ancora vinto, ho speso
794.280 volte la somma iniziale, e devo poter puntare 873.708 volte tale
posta nella speranza di avere un utile se vinco nel corso dell’undicesima
estrazione. Ed il tutto a fronte, in caso di vittoria, di solo poco più
che 79 volte la posta iniziale! Ho fatto un po’ di simulazioni di
martingala a Rouge et Noir, a
partire da un capitale iniziale pari a 10.0 e la prima puntata pari ad
1.0, ed inevitabilmente l’incauto giocatore è finito in bancarotta,
mediamente dopo 17 giocate (salvo un caso eccezionale, nel quale la
bancarotta è arrivata dopo ben 311 giocate, durante le quali il capitale
era salito fino a 114.214!). Una variante della martingala è il sistema di d’Alembert
(il matematico omonimo pare non entrarci per nulla): consiste nel
continuare a scommettere su un colore, facendo seguire ad ogni vittoria
una nuova puntata inferiore alla precedente, e ad ogni perdita una puntata
maggiore; la “logica” del sistema consiste nel fatto che, uscito ad
esempio un rosso, nel nuovo giro la pallina tenderà ad evitare di ripetere
il colore, per cercare di avvicinarsi alla media teorica del 50% (sempre a
meno dello zero). Ovviamente questo errore è ben noto agli studiosi di
probabilità, ed il sistema di d’Alembert non ha nessun serio vantaggio
rispetto alla martingala. L’unica differenza fra i due è che in questa
esiste una probabilità (peraltro non equa) di conseguire numerose
piccole vincite ma anche improvvise grosse perdite, mentre con il sistema
di d’Alembert succede il contrario: si continuano ad accettare piccole
perdite nella speranza di una grossa vincita. È chiaro quanto tali meccanismi siano perversi, un po’
come, giocando a poker, chi ha meno soldi da puntare viene alla lunga
inevitabilmente battuto da un giocatore, magari mediocre, ma più ricco. Parrebbe, anche se sono troppo digiuno di giochi di
carte per capire i dettagli del procedimento, che l’unico gioco da casinò
che talora offre un modesto vantaggio al giocatore
sia
il Black
Jack. Lo
scommettitore deve essere in grado di ricordare in ogni momento tutte le
carte estratte sino a quel punto, ed essere dotato di una discreta
capacità di fare calcoli mentali. Naturalmente non tutti sono in grado di fare fronte a
queste necessità, e potersi portare dietro un piccolo calcolatore farebbe
assai comodo, ma le case da gioco non sono d’accordo. Pure, è rimasto
famoso il caso di Keith Taft (the
fastest toes in the West). Questo brillante tecnico elettronico nel
1972 (con la tecnologia dell’epoca!) costruì una specie di personal
computer portatile, che egli indossava sotto i vestiti. L’output era
ottenuto tramite microscopici led inseriti all’interno della spessa
montatura degli occhiali, e l’input avveniva mediante microinterruttori
spinti tramite le dita dei piedi (da cui il soprannome di Keith)!
L’autonomia delle batterie non consentiva più di un’ora di attività.
Benché anche così bardato Keith non fosse mai riuscito ad ottenere vincite
clamorose al Black Jack (al
massimo vinse 1,300 dollari in un’ora, e perse 4,400 dollari in 40 ore),
ciò non di meno non venne mai scoperto, e fu lui stesso ad auto
denunciarsi alla fine del 1973. Per quanto incredibile, la storia è rimasta una pietra
miliare negli annali della criminalità informatica, ed è ampiamente
trattata (con foto) nel libro di Donn Parker (Op. cit.).
La
Microsoft ed
il 666 Recentemente, un sito di Internet ha offerto agli
utenti tre accostamenti fra il numero maledetto 666 ed il mondo della
Microsoft; personalmente ritengo che i primi due siano abbastanza stupidi,
mentre invece il terzo è eccellente. Iniziando con Bill Gates III (nel sito il fondatore
della Microsoft è presentato con questo nome), sommando i codici ASCII
delle lettere che ne compongono il nome, e contando ciascuno degli I come
un uno, si ha: 66+73+76+76+71+65+84+69+83+1+1+1 = 666
; Il secondo accostamento prende in esame il sistema
operativo Windows 95; facendo la medesima operazione, ed aggiungendo (chi
sa perché?) un 1 al tutto, si ha: 87+73+78+68+79+87+83+57+53+1 = 666 ; Finalmente, il migliore dei tre; prendendo il sistema
operativo MS-DOS 6.21 (attenzione allo spazio bianco prima di 6.21), si ha
la somma: 77+83+45+68+79+83+32+54+46+50+49 = 666
! (Continua sul
prossimo numero)
|
pagina iniziale articolo successivo