Noi di...

Gennaio- Febbraio 2010 - ANN0 VIII nn. 1-2

 

pagina iniziale          articolo successivo                                         

  

 

 

  

I numeri nei millenni

 

V

   di Stefano Breccia

 

* * *

I numeri nella storia dell’umanità

(terza parte: 1.7)

la cultura dei numeri

___________

Approfondimenti 6

 

Statistica, probabilità e affini

 

 

È assai diffusa l’opinione che le statistiche siano da prendersi con le molle. Come ebbe a dire Benjamin Disraeli:

 Ci sono tre tipi di bugie: le bugie, le maledette bugie, e le statistiche

e ciò parrebbe confermato dalla simpatica foto (tratta dal gradevole libro di De Crescenzo, “La Napoli di Bellavista”).

Pur senza giungere a tanto, va comunque fatto presente che, anche se le statistiche non mentono (ammesso che i dati su cui si basano siano reali!), da un lato è abbastanza facile piegarle a sostenere una qualunque opinione (come appare nella foto), dall’altro è analogamente facile, pure se gli effetti sono ben più insidiosi, prendere lucciole per lanterne in perfetta buona fede.

 

Esistono difatti proprietà non molto conosciute dai non addetti ai lavori, per effetto delle quali può accadere che la natura del fenomeno in esame, così come presentata da una statistica, sia contraria a quello che il buon senso pare suggerire. Si parla in questi casi di paradossi, anche se il termine è improprio, in quanto l’errore è nella mente di chi giunge a false conclusioni.

 

Iniziamo con un esempio particolarmente semplice. Immaginiamo che un signore voglia acquistare un prodotto, e conduca una piccola ricerca di mercato al fine di determinare che cosa, fra quanto offre il mercato, meglio risponda a due requisiti ritenuti importanti. Per fissare le idee, pensiamo che l’oggetto in questione sia un’automobile, ed il futuro acquirente ne voglia comprare una che al meglio soddisfi le caratteristiche di essere comoda ed economica.

 

Il nostro (semplifichiamo) decide di scegliere fra i costruttori ameri­cani e quelli europei; esamina quindi cinque macchine prodotte negli USA, e cinque prodotte nel vecchio continente, assegnando a ciascuna un voto lapidario (+, -) in relazione ai due requisiti prefissati, giungendo a stilare la seguente tabella:

                             com.      ec.                          com.     ec.    

      amer.1        +          +              eur.1         +          +

      amer.2        -           +              eur.2         -           -

      amer.3        -           +              eur.3         +          +

      amer.4        +          -               eur.4         -           -

      amer.5        +          -               eur.5         -           -

Le macchine americane hanno tre + in entrambe le colonne, contro quelle europee che ne hanno solo due; parrebbe quindi ovvio che la scelta debba cadere sui costruttori d’oltre oceano. In realtà le cose stanno esattamente al contrario, in quanto, fra le dieci vetture esaminate, due europee e solo una americana hanno riportato un + in entrambe le colonne, quindi la probabilità di trovare una buona macchina americana è del 20%, contro il 40% (esattamente il doppio!) di trovarne una buona in Europa.

 

Il secondo esempio, appena un poco più complesso, è un caso di quello che è noto come “Paradosso di Simpson” (dal nome dello statistico inglese che ne ha scritto nel 1951); seguendo l’articolo di Simpson, immaginiamo che due dottori vogliano verificare l’ipotesi secondo la quale un certo farmaco sia più vantaggioso sugli uomini che sulle donne. I due quindi conducono separatamente un lungo periodo di esperimenti, ed alla fine scrivono un dotto articolo congiunto, nel quale affermano di ritenere di aver potuto verificare l’ipotesi di partenza.

 

Le loro affermazioni si basano sulla seguente tabella riepilogativa:

 

                           dottore A                               dottore B

                uomini             donne              uomini            donne

utile        300  (43%)      100  (33%)       400  (67%)      700  (64%)

inutile     400  (57%)      200  (67%)       200  (33%)      400  (36%)

 

Il dottor A ha difatti rilevato come la cura risulti utile sul 43% di pazienti maschi, contro solo il 33% di donne; il dottor B ha risultati un poco più modesti, in quanto il farmaco ha giovato al 67% di maschi contro il 64% di donne. In entrambi i casi, comunque, gli uomini che hanno tratto giovamento dalla cura sono risultati in percentuale maggiore rispetto alle donne, e ciò ha confortato i due medici a ritenere confermata l’ipotesi iniziale.

 

È invece evidente (anche se non plateale) che i dati sperimentali sono leggermente contrari a tale ipotesi; se difatti si tiene conto di tutto l’universo delle cavie (pare che purtroppo molto spesso persone che si ritengono pazienti sono invece delle cavie a loro insaputa!), si ha la seguente tabella:

 

                              uomini                            donne

          utile             700   (54%)                  800    (57%)

          inutile          600   (46%)                  600    (43%)

 

Va notato che, con gli stessi dati iniziali, si sarebbe potuta stilare ancora un’altra tabella (che qui presentiamo con le sole percentuali, in quanto i dati numerici assoluti sono gli stessi). In questa tabella, per ogni dottore, e per il totale dell’universo, si calcolano le percentuali fra maschi e femmine nei due casi separati di successo e di fallimento della cura:

 

                           dr. A                dr. B                  totale

                      (M)       (F)         (M)    (F)          (M)     (F)

         utile       75%     25%       36%   64%       47%     53%

         inutile     67%    33%       33%   67%       50%     50%

 

Facendo i conti in questo modo, è evidente che i dati ottenuti dal dottor A contraddicono sempre i corrispondenti risultati del dottor B: nel caso di successo, per A gli uomini sono stati il 75% del totale, mentre per B sono le donne ad avere la maggioranza, con il 64%; un particolare che avrebbe dovuto far pensare i nostri clinici è che, per entrambi i dottori, la maggioranza corrisponde allo stesso sesso sia in caso di successo che di fallimento! Per il dottor A, ad esempio, gli uomini sono stati il 75% fra quanti hanno tratto beneficio dalla cura, ma anche il 67% (ancora la mag­gioranza) fra quanti non ne hanno tratto alcun vantaggio. Per il dottor B si ha ancora un fenomeno analogo, con la differenza che adesso sono le donne ad essere in predominio. Anche in questo caso, comunque, le percentuali riassuntive rendono giustizia al fatto che, globalmente, sono state le donne ad avere un sia pur modesto predominio (53% verso 47%) fra quanti hanno tratto giovamento, mentre sono in parità fra gli altri.

  

Un eventuale giudizio conclusivo sull’ipotesi di partenza è evidentemente che essa è priva di fondamento; attenzione, però, in quanto il sostenere vera l’ipotesi opposta (il farmaco giova più alle donne che agli uomini), quand’anche effettivamente supportata dai dati, ha una preponderanza troppo piccola per poter essere significativa. Pertanto si può concludere che è sbagliato ritenere che esista una risposta differenziata per sesso all’uso di quel particolare farmaco.

 

Come si vede, quindi, usando gli stessi dati è stato possibile sostenere sia un’ipotesi che il suo contrario, mentre la verità è che la domanda è stata mal posta, e, più importante ancora, che il campione sperimentale coinvolto non è stato scelto con oculatezza.

 

Il paradosso di Simpson è stato riscoperto più volte in episodi reali, spesso allorché si presentavano, a sostegno di una tesi, casi favorevoli tratti da ambiti indipendenti fra di loro, con numerosità sensibilmente diverse. È rimasto famoso uno studio, condotto negli States allorché si iniziava a tentare di contrastare presunte disparità di trattamento, prima fra i due sessi (agli albori del femminismo), poi fra i WASP (White, Anglo-Saxon, Protestant) e le cosiddette minoranze. È risultato (Bickel et alii, Op. cit.) che, contro tutte le apparenze, all’università di Berkeley, in California, erano proprio gli studenti maschi e WASP ad essere trattati leggermente peggio degli altri.

 

Con eguale logica (!) si è sostenuto ad esempio che negli Stati Uniti i tassisti sono per la maggioranza di origine russa, dal che, in nome di una ipotetica equa distribuzione dei conducenti di auto pubbliche nel mondo, dovrebbe discendere il fatto che in Russia la maggioranza dei tassisti sia di origine americana!

 

Un altro esempio (tipico delle cronache politiche italiche) si trova spesso nei commenti ai risultati elettorali (cfr. foto di cui sopra). Immaginiamo che ci siano tre partiti (A, B e C) che concorrono in tre provincie del nord (P1, P2 e P3) ed in tre provincie del sud (P4, P5 e P6), e che i risulta­ti finali siano:

 

              P1    P2     P3           P4     P5    P6      totali

       A     51    17      15           14     40    20       157

       B     44    15      14           12     50    25       160

       C     10      9       8            13    70     30      140

  eletto     A      A       A             A      C     C

 

Fra i commenti non si mancherà certo di sottolineare il fatto che A abbia vinto nel 67% dei casi, mentre C ha vinto nel 67% dei casi nel sud; inoltre B non ha mai vinto, pur avendo avuto complessivamente la maggioranza dei voti; nella provincia P5 (quella più numerosa) C ha sfiorato la maggioranza assoluta, essendosi attestato al 44%, mentre in P1 (seconda per numerosità) è stato A a sfiorare la maggioranza con il 49%, eccetera, eccetera, pietosamente eccetera; già con tre partiti e sei provincie si potreb­be parlare per diverse pagine; figurarsi che cosa accade quando entrambi questi numeri aumentano a dismisura; d’altronde la domanda precedente è purtroppo retorica, in quanto periodicamente assistiamo ad esplosioni di commenti a valle dell’ennesima tornata elettorale!

 

È vero che il meccanismo elettorale è prono di per sè a situazioni paradossali, proprio per il modo con cui vengono condotte le elezioni; nel 1980 il prof. Davis Morton, del City College di New York, tentò (Op. cit.) di formalizzare in cinque punti le regole cui dovrebbe aderire una tornata elettorale al fine di evitare esiti paradossali, ma la conseguenza, a sua volta paradossale, è che non può esistere alcun meccanismo elettorale che possa adeguarvisi! Tanto vale quindi mettersi l’animo in pace ...

 

Passiamo ad altro. Un gioco d’azzardo (fortunatamente poco diffuso) negli States si basa su tre cartoncini: uno ha le facce entrambe rosse, il secondo entrambe bianche, il terzo ha una faccia rossa e l’altra bianca; ogni carta è chiusa entro un involucro separato, e opaco. Dopo aver mescolato, il croupier estrae una carta e la poggia sul tavolo, usando tutta la cautela possibile affinché la faccia nascosta resti invisibile; immaginiamo che la faccia scoperta sia rossa; a questo punto il nostro propone all’incauto astan­te di accettare una scommessa alla pari che la faccia nascosta sia anch’essa rossa; in effetti, arguisce, questa faccia può solo essere bianca o rossa, quindi le probabilità sono entrambe del 50%. È intuibile che non convenga accettare, ma perché? Ripensandoci un attimo, è evidente che ci sono tre facce rosse nel mazzo, ma a due di esse corrisponde una faccia di uguale colore. Il croupier ha quindi due probabilità su tre di vincere la scommessa.

 

Un altro gioco “per gonzi” è il Bird Cage (anche Chuck-a-luck), discretamente diffuso negli USA: il giocatore punta una somma su un numero (fra uno e sei), ed il croupier lancia tre dadi; se il numero puntato esce una volta, il giocatore ha una vincita netta pari alla somma (riceve indietro, cioè,  il  doppio di quanto aveva puntato);  la vincita  sale a due volte la posta se il numero compare due volte, a tre volte la posta se tutti e tre i dadi si fermano sul numero puntato.

 

Ci si aspetta che il gonzo in questione ragioni, più o meno, così: la probabilità che il numero esca su un dado è di 1/6, quindi su tre dadi è di 1/2, e quindi il gioco è alla pari nel caso di una sola uscita; dato però che può darsi che il numero esca anche due o tre volte, queste sono tutte proba­bilità a favore dello scommettitore, per cui il gioco è a vantaggio di quest’ultimo.

 

Naturalmente la diffusione del Bird Cage dovrebbe da sola dimostrare l’erroneità di questo ragionamento, ma, contemporaneamente, sottolinea la quantità di gente che vi cade!

 

Un ulteriore esempio (proposto nel 1713 da Niklaus Bernoulli) coin­volge due giocatori, diciamo A e B, ed una moneta; A inizia il gioco conse­gnando a B una somma S di denaro. B lancia la moneta; se esce testa, B paga ad A un’unità (diciamo un dollaro) ed il gioco termina; altrimenti B lancia ancora la moneta; se esce testa al secondo lancio, B paga ad A due dollari, altrimenti prosegue; se esce testa al terzo lancio, paga 4 dollari, e così via.

 

In definitiva, B continua a lanciare la moneta fintanto che ottiene croce; se esce testa all’n-esimo lancio, B paga ad A una somma pari a 2n dollari. Il problema consiste nel determinare quanto debba valere la somma iniziale S affinchè il gioco sia equo.

 

L’imprevista risposta è che la somma iniziale deve essere infinita affinché il gioco sia equo; per un qualunque valore finito di S, A si trova leggermente in vantaggio.

 

Vale la pena di ricordare che il problema, sebbene corretto da un punto di vista formale, non lo è affatto in termini concreti; perché, difatti, la risposta di Bernoulli fosse ammissibile, sarebbe necessario poter disporre di un tempo di gioco infinito, e, ovviamente, di somme di denaro infinite; sarebbe interessante provare a rifare i calcoli prevedendo un numero massimo di lanci, od un valore massimo ammesso per vincite e perdite. Per inciso, questa è la constatazione che sfugge a quanti si illudono di vincere ad un qualunque gioco utilizzando un sistema che consiste nell’incrementare la posta dopo ogni sconfitta: quand’anche esistessero sistemi vincenti del genere (e sono purtroppo assai rari!) esiste sempre la possibilità che il giocatore debba arrestarsi per avere dato fondo alle sue risorse prima di raggiungere l’ipotetico colpo fortunato.

 

Pensiamo di giocare al Rouge et Noir alla roulette: la probabilità che esca un numero rosso è 1/2 (in realtà 18/37, a causa della presenza dello zero, che altera le probabilità in favore del casinò, ma dimentichiamoci dello zero per fare i conti tondi). Se io punto una somma S sul rosso, ed esce nero, ho evidentemente perso S. Potrei sperare di rifarmi puntando ancora S, magari (ma questo è inessenziale) ancora sul rosso: se difatti vincessi, tornerei in pari.

 

Alla seconda sconfitta, devo ora puntare 2·S se voglio sperare di rifarmi, con un’eventuale vincita, delle perdite sin qui sostenute. Se vinco, tutto va bene, ma in caso contrario dovrò puntare 4·S, e così via.

 

Naturalmente, prima o poi, dovrò pur vincere, per cui questo banale meccanismo (ovviamente semplificato in quanto non tiene conto dello zero, e non prevede nessun guadagno finale) mi “assicura” che prima o poi uscirò dalla casa da gioco con esattamente tanti soldi quanti ne avevo all’ingresso, ammesso però che io sia capace di sostenere le successive scommesse sufficientemente a lungo. È difatti evidente che il totale delle somme investite sale assai rapidamente. Una leggera variante di questo metodo, che assicura (per modo di dire) una effettiva vincita positiva; viene detta “martingala”.

 

A puro titolo di esempio, la tabella successiva mostra come si incre­menta l’investimento generale, pensando di scommettere a Rouge et Noir, tenendo conto della presenza dello zero, e mirando ad un guadagno utile del 10% al primo successo:

 

             1      Punt.         1.000         perso            1.000

             2      Punt.         1.100         perso            2.100

             3      Punt.         2.310         perso            4.410

             4      Punt.         4.851         perso            9.261

             5      Punt        10.187         perso          19.448

             6      Punt.       21.393         perso          40.841

             7      Punt.       44.925         perso          85.766

             8      Punt.       94.343         perso        180.109

             9      Punt.     198.120         perso        378.229

           10      Punt.     416.052         perso        794.280

           11      Punt.     873.708         perso      1667.988

 

Se dopo dieci estrazioni non ho ancora vinto, ho speso 794.280 volte la somma iniziale, e devo poter puntare 873.708 volte tale posta nella speranza di avere un utile se vinco nel corso dell’undicesima estrazione. Ed il tutto a fronte, in caso di vittoria, di solo poco più che 79 volte la posta iniziale! Ho fatto un po’ di simulazioni di martingala a Rouge et Noir, a partire da un capitale iniziale pari a 10.0 e la prima puntata pari ad 1.0, ed inevitabilmente l’incauto giocatore è finito in bancarotta, mediamente dopo 17 giocate (salvo un caso eccezionale, nel quale la bancarotta è arrivata dopo ben 311 giocate, durante le quali il capitale era salito fino a 114.214!).

 

Una variante della martingala è il sistema di d’Alembert (il matematico omonimo pare non entrarci per nulla): consiste nel continuare a scommettere su un colore, facendo seguire ad ogni vittoria una nuova puntata inferiore alla precedente, e ad ogni perdita una puntata maggiore; la “logica” del sistema consiste nel fatto che, uscito ad esempio un rosso, nel nuovo giro la pallina tenderà ad evitare di ripetere il colore, per cercare di avvicinarsi alla media teorica del 50% (sempre a meno dello zero). Ovviamente questo errore è ben noto agli studiosi di probabilità, ed il sistema di d’Alembert non ha nessun serio vantaggio rispetto alla martingala. L’unica differenza fra i due è che in questa  esiste una probabilità (peraltro non equa) di conseguire numerose piccole vincite ma anche improvvise grosse perdite, mentre con il sistema di d’Alembert succede il contrario: si continuano ad accettare piccole perdite nella speranza di una grossa vincita.

 

È chiaro quanto tali meccanismi siano perversi, un po’ come, giocando a poker, chi ha meno soldi da puntare viene alla lunga inevitabilmente battuto da un giocatore, magari mediocre, ma più ricco.

 

Parrebbe, anche se sono troppo digiuno di giochi di carte per capire i dettagli del procedimento, che l’unico gioco da casinò che talora offre un modesto vantaggio al  giocatore  sia  il Black Jack. Lo scommettitore deve essere in grado di ricordare in ogni momento tutte le carte estratte sino a quel punto, ed essere dotato di una discreta capacità di fare calcoli mentali.

 

Naturalmente non tutti sono in grado di fare fronte a queste necessità, e potersi portare dietro un piccolo calcolatore farebbe assai comodo, ma le case da gioco non sono d’accordo. Pure, è rimasto famoso il caso di Keith Taft (the fastest toes in the West). Questo brillante tecnico elettronico nel 1972 (con la tecnologia dell’epoca!) costruì una specie di personal computer portatile, che egli indossava sotto i vestiti. L’output era ottenuto tramite microscopici led inseriti all’interno della spessa montatura degli occhiali, e l’input avveniva mediante microinterruttori spinti tramite le dita dei piedi (da cui il soprannome di Keith)! L’autonomia delle batterie non consentiva più di un’ora di attività. Benché anche così bardato Keith non fosse mai riuscito ad ottenere vincite clamorose al Black Jack (al massimo vinse 1,300 dollari in un’ora, e perse 4,400 dollari in 40 ore), ciò non di meno non venne mai scoperto, e fu lui stesso ad auto denunciarsi alla fine del 1973.

 

Per quanto incredibile, la storia è rimasta una pietra miliare negli annali della criminalità informatica, ed è ampiamente trattata (con foto) nel libro di Donn Parker (Op. cit.).

 

La Microsoft ed il 666

 

Recentemente, un sito di Internet ha offerto agli utenti tre accostamenti fra il numero maledetto 666 ed il mondo della Microsoft; personalmente ritengo che i primi due siano abbastanza stupidi, mentre invece il terzo è eccellente.

 

Iniziando con Bill Gates III (nel sito il fondatore della Microsoft è presentato con questo nome), sommando i codici ASCII delle lettere che ne compongono il nome, e contando ciascuno degli I come un uno, si ha:

 

66+73+76+76+71+65+84+69+83+1+1+1 = 666 ;

 

Il secondo accostamento prende in esame il sistema operativo Windows 95; facendo la medesima operazione, ed aggiungendo (chi sa perché?) un 1 al tutto, si ha:

 

87+73+78+68+79+87+83+57+53+1 = 666 ;

 

Finalmente, il migliore dei tre; prendendo il sistema operativo MS-DOS 6.21 (attenzione allo spazio bianco prima di 6.21), si ha la somma:

 

77+83+45+68+79+83+32+54+46+50+49 = 666 !

 

(Continua sul prossimo numero)

 

 

  

pagina iniziale          articolo successivo