Saturday, September 18, 2010

HATTRICK - Il "Random" nell'Assegnazione delle Azioni








Argomento scottante il "random", una garanzia di discussioni infiammate nei vari thread che vengono costantemente aperti al riguardo nei forum.

Come avrà visto chi si è scorso la colonnina qui a destra coi passati articoli, all'argomento ho già dedicato qualche post

http://www.fergo.co/2010/04/hattrick-nuovo-motore-e-random.html
che mi rendo conto piuttosto tecnico e complesso
e
http://www.fergo.co/2010/08/hattrick-tattica-strategia-random.html

Ora prendo spunto da uno scambio di idee con l'amico Laiho per mettere giù qualche considerazione, cercando di essere il meno tecnico e complesso possibile. Restringo l'analisi al solo confronto tra i centrocampi e all'assegnazione delle azioni.
Vediamo cosa ne vien fuori.


****


Il confronto che spesso vien fatto è tra "Vecchio" motore, antecedente a gennaio 2010, e "Nuovo" motore, seguente a tale data. Si tratta di una distinzione impropria.
Il motore infatti è sempre quello: si basa su un'estrazione aleatoria, solo che è stato modificato il loro numero (da 10 a 15 secondo gli studi effettuati) e le conseguenze dell'estrazione stessa (in 10 casi su 15). Quindi cambio la dicitura da "Vecchio" e "Nuovo" motore, in "PRE" e "POST" modifiche. Mi sembra più coerente con la realtà.

Ora, il punto è: queste modifiche hanno inciso sull'aleatorietà ("random") nell'assegnazione delle azioni?
Proviamo a fare due conti che vi spiego passo passo.




1) PRE Modifiche


Cominciamo dalla base, un valore per il CC del Team 1 e uno per quello del Team 2, supponiamo che il primo valga 9 e il secondo 8. Il possesso sarà del 56.25% a favore del primo team e la probabilità di azioni sarà del 58.74% per lo stesso team (ho indicato le formule utilizzate, dove P3 e Q3 sono le celle dei valori dei due CC)





Prima delle modifiche venivano generate 10 azioni. Ogni azione veniva assegnata al Team 1 oppure al Team 2 in base alla probabilità calcolata con la formula che nell'esempio è P3^3/(P3^3+Q3^3)
Quindi, dato il valore della cella "Probabilità che l'azione venga assegnata al Team 1", che nel mio foglio è nella cella P10, posso procedere all'estrazione di 10 azioni in cui se il valore casuale generato da Excel è minore del valore in P10 allora l'azione venga assegnata al Team 1, se è superiore, venga assegnata al Team 2. La formula è SE(CASUALE()<$P$10;1;2)

Ecco qui:


Vedete che le varie azioni vengono assegnate ai due team.
In totale sono 7 al team 1 e 3 per il team 2. Il rapporto "Azioni Team 1 / Azioni Team 2" è di 7/3 = 2.33 cioè il 233%

Naturalmente l'esperimento si può ripetere a volontà e nel foglio che trovate allegato alla fine l'ho ripetuto per 1000 partite simulate.



Dopodiché passo a contare quante volte si presenta un certo numero di azioni per ogni Team


quindi su 1000 partite avrò, in questa simulazione, il 26.6% di partite con 6 azioni al team 1 (e quindi con 4 per il team 2), il 21.4% di partite con 5 azioni al team 1 (e quindi con 5 per il team 2) ecc...
Se considero la distribuzione delle azioni vedo che ho
  • nessun caso di "0 azioni al Team 1 e 10 al Team 2", con il corrispondente valore di "Azioni del Team 1 / Azioni del Team 2" pari a 0/10=0.0%
  • 1 caso su 1000 partite di "1 azione al Team 1 e 9 al Team 2", con il corrispondente valore di "Azioni del Team 1 / Azioni del Team 2" pari a 1/9=11.1%
  • 11 casi su 1000 partite di "2 azioni al Team 1 e 8 al Team 2", con il corrispondente valore di "Azioni del Team 1 / Azioni del Team 2" pari a 2/8=25.0%
  • 53 casi su 1000 partite di "3 azioni al Team 1 e 7 al Team 2", con il corrispondente valore di "Azioni del Team 1 / Azioni del Team 2" pari a 3/7=42.9%
  • ecc
tutto questo si può vedere in questa tabella (#DIV/0! si riferisce al caso di 10 azioni al team 1 e 0 al team 2 e 10/0 dà quell'errore):





2) POST Modifiche

Con le modifiche di inizio 2010 sono state introdotte le Azioni "Esclusive".
In soldoni, prima venivano estratte 10 azioni e "o era mia o era tua"
ora ne vengono estratte 15, di cui 5 come prima "o è mia o è tua" (Azioni "Comuni"), 5 "o è mia o di nessuno" e 5 "o è tua o di nessuno" (Azioni "Esclusive")
Quindi per le azioni
  • COMUNI la formula resta SE(CASUALE()<$U$10;1;2), cioè o al team 1 o al team 2
  • ESCLUSIVE la formula diventa SE(CASUALE()<$U$10;1;0) per quelle solo per il team 1 e SE(CASUALE()<$U$10;0;2) per quelle solo per il team 2
Il foglio si modifica facilmente così:


Solite 1000 partite simulate e solita raccolta di dati che dà la seguente tabella


Fin qui tutto semplice, ora invece arriva uno scoglio: sapere quante azioni ha il team 1 non ci dice quante ne ha il team 2. Prima era semplice: il team 1 ne aveva 7? allora il 2 ne aveva 3. Ora invece se il team 1 ne ha 7 il team 2 ne potrebbe avere un numero qualsiasi da 0 a 8.
Quindi la semplice tabella vista sopra con i soli 11 casi di valori "Azioni Team1 / Azioni Team2" diventa molto più complessa: i valori ora sono 57!

Ecco qui la tabellona




Ora: come procedere al confronto coi valori precedenti, Pre modifiche?

Procedo con un paragone per chiarire la questione.
E' come se stessimo analizzando le altezze di un gruppo di persone.
Prima avevamo una cosa semplice tipo:

ora ci troviamo con una tabella di questo tipo

E' chiaro che un grafico a istogrammi o una curva delle frequenze direbbe molto poco data la dispersione dei valori nel secondo caso.

Potrei anche essere arrugginito in statistica, del resto sono passati parecchi anni, ma l'unica cosa che mi viene in mente per fare un confronto tra i due casi è uno strumento dell'analisi statistica descrittiva: la funzione di ripartizione. In sostanza andiamo a vedere "Quanti sono i casi in cui si è già presentato un dato fenomeno", ossia non "Quanti hanno una certa altezza", ma "Quanti SONO INFERIORI a una certa altezza". Le tabelle precedenti diventano


e, nel secondo caso


ora un confronto è possibile (chiaramente la prima tabella procederà "a gradini"), ma comunque avremo un'idea:


vedete che le curve fanno la stessa strada (conseguenza del fatto che i valori nella seconda tabella li ho ottenuti "spalmando" quelli della prima in valori vicini), la curva rossa dei primi dati procede a gradini per definizione, ma in sostanza non vi sono variazioni. La curva blu è solo la curva rossa più dettagliata, ma sono lo stesso fenomeno.

Se invece le 77 persone nella tabella più dettagliata avessero una distribuzione differente e fossero tutte piuttosto alte (ad es. solo 40 su 77 inferiori a 180cm), allora in tal caso avremo due curve molto diverse:



Ora, forti di queste conoscenze, torniamo a considerare le nostre distribuzioni pre e post modifiche, dati che vedete nel foglio "CONFRONTO" del file Excel allegato. Analogamente a quanto appena visto sopra consideriamo i casi di "% di Azioni Team1 / Team2" inferiore o uguale a un certo valore e quindi otteniamo curve di questo tipo


oppure, ancora meglio, considerando i valori nell'asse X come scala tempo




Curve che, come visto sopra, descrivono esattamente lo stesso fenomeno.

La curva "POST modifiche" o del "Nuovo" motore non fa altro che descrivere più dettagliatamente quella precedente. Le differenze avvertibili in termini di "Variazione dell'Assegnazione in % di Azioni al Team 1 rispetto a quelle assegnate al Team 2" sono proprio nell'addolcimento della curva stessa, nel suo avvicinamento alla forma della funzione di ripartizione di una gaussiana standard


Riduzione del "random" quindi? La risposta è, "dipende da cosa intendiamo per random".
Se per "random" intendiamo un "allontanamento statisticamente avvertibile da un'assegnazione equa delle azioni (intendendo con equa quella relativa alla gaussiana)" allora la risposta non può che essere positiva, nei termini visti sopra, dovuti all'addolcimento della curva.

Rappresentiamo la gaussiana nella curva per spiegare meglio questo concetto:


E' evidente che la curva blu, del POST modifiche, seguendo più da vicino la gaussiana realizza nella realtà meno situazioni "aberranti" rispetto a prima. Ad esempio prendiamo il valore nell'asse X pari a 150, cioè 150% di azioni del team 1 rispetto al team 2 (il team 1 ha una volta e mezza le azioni assegnate al team 2, nel PRE modifiche era il caso "6" al team 1 e "4" al team 2).
La distribuzione "equa" nella gaussiana è 500 partite, nella curva rossa era "636" partite, mentre in quella blu diventa "578" partite, più vicino al valore equo.
Senza passare valore per valore è evidente come la curva blu sia generalmente più vicina a quella verde e quindi realizzi complessivamente un numero inferiore di casi aberranti rispetto all'equità.


QUI il file

http://sites.google.com/site/andreactools/home/AZIONIVECCHIOENUOVO.xlsx?attredirects=0&d=1




****


Visto le mail che sto ricevendo aggiungo una nota finale: non vi è alcuna riduzione delle situazioni "estreme", ma una più equa distribuzione "nel mezzo"
ed esempio:
il team 1 ha CC che vale 9.5
il team 2 ha il CC che vale 8
probabilità di azioni per il team 1 è 62.61%
probabilità di azioni per il team 2 è 37.39%
una distribuzione equa sarebbe quella che assegna il 62.61%/37.39% = 167.46% di azioni al team 1 rispetto al team 2

La versione PRE modifiche può assegnare
6 al primo e 4 al secondo = 150.00%
7 al primo e 3 al secondo = 233.33%
non ci si può avvicinare di più al 167.46% ideale

la versione POST modifiche invece può assegnare
8 al primo e 5 al secondo = 160.00%
5 al primo e 3 al secondo = 166.67%
7 al primo e 4 al secondo = 175.00%
tutti valori più vicini al 167.46% ideale
in QUESTO sta la maggiore equità




da un punto di vista numerico
  • PRE modifiche: se le azioni del team 1 sono X allora quelle del team 2 sono (10-X)
  • POST modifiche: se le azioni del team 1 sono X allora quelle del team 2 sono un numero variabile tra 0 e Min(10;15-X), col vincolo che la somma sia almeno pari a 5 (le azioni comuni che devono comunque essere assegnate)
Questa flessibilità di azioni per il team 2 consente di avvicinarsi maggiormente al valore equo di assegnazione delle azioni che è dato da "probabilità di azioni per il team 1"/"probabilità di azioni per il team 2"

le formule per calcolare questa funzione sono note e sono, indicando con cc1 e cc2 i valori dei due centrocampi
cc1^3/(cc1^3+cc2^3) / cc2^3/(cc1^3+cc2^3)
che si semplifica in

cc1^3 / cc2^3

questo è il VALORE EQUO di assegnazione delle azioni

è una linea continua... molto più facile da avvicinare quando le azioni del team 2 possono variare tra 0 e 15-X (la curva piu' dolce vista sopra) rispetto a quando sono bloccate a 10-X (e procedono "a gradini").
Oppure, detta in altro modo, nel PRE modifiche avevo solo 11 valori a disposizione (0,00% 11,11% 25,00% 42,86% 66,67% 100,00% 150,00% 233,33% 400,00% 900,00% #DIV/0!) per approssimare una curva continua, mentre nel POST modifiche ne ho ben 57, ed è quindi molto più facile avere un valore vicino a quello equo.

PS. dai un occhio all' INDICE del blog, ci sono parecchi articoli che ti potrebbero interessare.




Andreac (team ID 1730726 in Hattrick)

Creative Commons License
This opera by Andreac is licensed under a Creative Commons Attribuzione-Non commerciale 3.0 Unported License. Cioé questo lavoro può essere liberamente copiato, distribuito o modificato senza espressa autorizzazione dell'autore, a patto che l'autore sia chiaramente indicato e la pubblicazione non sia a fini commerciali.
Any source

No comments:

Post a Comment