Jump to content
Sign in to follow this  
Lonewolf

Statistica

Recommended Posts

Lonewolf

C'e' qualche esperto di statistica nel forum? (Joefish, Rapace ...)

Ho bisogno di un suggerimento :pardon:(non centrano i peperoncini)

 

Ho un elenco di valori che rappresentano previsioni (ripetute nel tempo) di ordini clienti per un certo periodo.

Per esempio, nella settimana 1/2018 il cliente prevede che in aprile/maggio/giugno ordinera' 100 pezzi.

Nella settimana 2/2018 prevede che ne ordinera' 90.

Nella settimana 3/2018 prevede che ne ordinera' 102.

ecc 

L'operazione si ripete con variazioni (dettate da una grande varieta' di parametri) fino a quando il cliente fissa la quantita' definitiva emettendo l'ordine effettivo.

 

Il problema che si pone e' individuare un qualche valore ricavato dall'elenco di valori che consenta di segnalare al cliente (e prima ancora a chi riceve le previsioni) se le previsioni subiscono troppe variazioni, oltre un certo livello prefissato.

 

Attualmente calcolo le variazioni percentuali tra ogni coppia di valori consecutivi e le sommo tutte insieme; emetto segnalazione se la somma supera un certo valore prefissato.

Il metodo va benissimo se le previsioni sono sempre crescenti (o decrescenti), ma ha dei limiti quando i valori sono altalenanti (es. 100, 90, 110, 80, 100); la somma algebrica delle percentuali di variazione puo' anche essere zero pur in presenza di valori molto variabili.

Posso effettuare la somma in valore assoluto, anche variazioni negative incrementano il valore totale, ma il risultato non mi convince.

 

C'e' un qualche valore statistico utile e significativo?

Mi basta il nome e il significato, poi penso io a recuperare la formula e a realizzare il calcolo pratico.

 

Grazie!

 

 

Share this post


Link to post
Share on other sites
joefish

Penso che Vincenzo abbia ragione.

 

Ho avuto difficolta' a capire cosa vuoi :pardon: 

Se ho capito bene quello che vuoi allora scarto quadratico medio potrebbe essere utile poiche' ti dice quanto e' larga la distribuzione dei dati.

In base al suo valore puoi dire se le variazioni sono "forti" o meno.

Resta da stabilire il valore di soglia che vuoi prefissare.

 

Per esempio i valori che hai indicato: 100, 90, 110, 80, 100

hanno media 96 e scarto quadratico medio (o deviazione standard) pari a 11.4

Per cui si potrebbe dire che il valore 80  sia una variazione forte.

 

La domanda che mi pongo e' se hai modo di capire questa soglia prima di vedere i dati.

Magari se metti qualche valore realistico possiamo ragionarci su.

Share this post


Link to post
Share on other sites
Lonewolf
12 minutes ago, joefish said:

Magari se metti qualche valore realistico possiamo ragionarci su.

 

I valori indicati (100, 90 ecc) sono realistici; trattandosi di componenti meccanici complessi, le quantita' sono sempre numeri interi dell'ordine di grandezza di alcune decine (per tre mesi).

 

Una variazione al metodo che ho gia' usato potrebbe essere dividere la somma percentuali per il numero di rilevazioni, ottenendo la variazione percentuale media.

Intanto cerco di capire il significato dello scarto quadratico medio.

 

La soglia non e' un problema, si puo' decidere/modificare anche a posteriori vedendo i primi risultati con i dati reali.

 

 

Per inquadrare meglio il problema, lo scopo delle previsioni e' consentire a chi le riceve di pianificare la produzione.

Le previsioni reali coprono un anno, ma a noi interessano in ogni momento quelle nei prossimi 3 mesi (e 6 mesi, ma i ragionamenti sono analoghi).

Ovviamente eventuali variazioni sono un problema perche' possono mettere in difficolta' la produzione (se le previsioni aumentano di molto quando ormai non c'e' piu' tempo per organizzarsi) o causare inutili giacenze di materiali in magazzino (se calano troppo quando ormai e' gia tutto pronto).

Sostanzialmente la segnalazione oltre un valore soglia ha il duplice scopo di allertare la produzione e anche di fornire un dato oggettivo per contestare al cliente i troppi errori nelle previsioni.

Share this post


Link to post
Share on other sites
Rapace

Oggi non ho tempo (putroppo devo stare dietro ad un problema piu' serio e meno divertente).

 

Varianza/scarto quadratico utili senz' altro (in pratica misurano di quanto si scostano i valori di una serie rispetto alla sua media).

 

Sarebbe interessante approfondire perché se serve un qualcosa per prevedere la produzione dei prossimi mesi probabilmente si riesce anche a sviluppare un modello basato su l' analisi di integrazione (se si hanno serie temporali sufficienti).

 

Appena ho un po' di tempo ci ragiono un po' di piu'.

Share this post


Link to post
Share on other sites
Rapace

Prima un paio di considerazioni cercando di semplificare poi una domanda.

 

Se ho capito bene tu hai bisogno di un indicatore di dispersione.

Hai una serie (chiamiamola Xndove n è il numero degli elementi della serie ed Xi, i=1...n il valore che assume l' i-esimo valorie della serie

 

Ovviamente tale serie avrà dei valori medi (media aritmetica, mediana etc.)

I valori medi indicano (rimando agli articoli di wikipedia sull'argomento per i dettagli, comunque penso siano concetti relativamente semplici per un informatico per lo meno) indicano con UN unico numero un valore che rappresenta "mediamente" la serie di valori.

 

Solitamente per rappresentare una serie di valori servono DUE numeri sintetici:

 

Uno che indica appunto un valore medio.

Uno che indica la dispersione rispetto al valore medio di cui sopra.

 

Ad esempio: Se ho un valore medio di 10 ed un valore di dispersione 0,1 vorrebbe dire che ho valori della serie che sono molto vicini al valore medio.

Quindi le oscillazioni sono "basse"

Se invece il valore di dispersione fosse 1 (sempre con riferimento ad un valore medio di 10) vorrebbe dire che le le "oscillazioni" dei valori della serie sono molto piu' ampie.

 

Ovviamente poi bisogna capire nel merito di che cosa si analizza e del risultato che si vuole ottenere cosa vuol dire "basso" o "alto" (ad esempio se sto testando uno strumento di precisione vorrò che la media sia quella "giusta" ed anche che le "oscillazioni" siano quasi inesistenti, se invece ragiono di altro avrò piu' margine). Questa analisi puo' basarsi sui risultati delle formule, ma poi necessita di approfondimenti ulteriori.

 

Torniamo alla misura della dispersione.

 

Ci sono due problemi solitamente "da risolvere" (per dare enfasi perché la soluzione è banale)

 

1. Far si che le oscillazioni positive e negative non ci compensino (a meno che non misuri qualcosa dove questo mi sta bene, ma solitamente non è cosi').

2. Avere un indicatore (UN numero) che rappresenta la dispersione in % rispetto al valore medio (o comunque della stessa unità di misura di questo)

 

Per il punto 1 ci sono 2 modi:

 

- Considerare non il valore aritmetico (con segno) delle oscillazioni rispetto al valore medio, ma prendere il valore assoluto di questi o farne il quadrato

 

Se fai il quadrato ottieni la varianza ed hai il problema di avere la stessa unità di misura della media (in % rispetto al valore medio la trasformi facilmente) ma se fai la radice quadrata lo hai risolto (ottieni lo scarto quadratico medio o deviazione standard già menzionata).

Attenzione che se si ha un campione e non tutto l' universo dei valori allora puo' essere piu' giusto usare la deviazione standard corretta.

 

Per la mia esperienza è questo l' indicatore di dispersione (semplice) piu' utilizzato.

 

In alcuni casi puo' essere piu' appropriato utilizzare la Deviazione media assoluta https://it.wikipedia.org/wiki/Deviazione_media_assoluta

La deviazione standard "enfatizza" di piu' della deviazione media assoluta ad esempio i "picchi" di oscillazione.

 

Passo a domanda:

 

- I numeri da analizzare li ricevi in "input" ? o li devi "stimare" in base al comportamento storico ?

- Se li devi stimare.... come fai ? tieni conto di concetti quali quelli delle proprietà attese di uno stimatore ? (discorso sarebbe molto lungo qua)

  • Like 1

Share this post


Link to post
Share on other sites
Lonewolf

Tutto chiaro, grazie!

Due valori, media e scostamento dalla media sono esattamente quel che serve, mi sembra.

 

2 hours ago, Rapace said:

 

Passo a domanda:

 

- I numeri da analizzare li ricevi in "input" ? o li devi "stimare" in base al comportamento storico ?

- Se li devi stimare.... come fai ? tieni conto di concetti quali quelli delle proprietà attese di uno stimatore ? (discorso sarebbe molto lungo qua)

 

I numeri da analizzare li ricevo; si tratta di un flusso settimanale che per ciascun articolo contiene le previsioni settimana per settimana per un numero di settimane futuro che puo' arrivare fino ad un anno (ma a chi riceve interessa la somma dei primi 3 mesi e, in minor misura, dei 3 successivi.

 

Come i valori siano stimati e' un problema di chi li invia ... evidentemente non li stima molto bene, visto che il problema nasce appunto dalla necessita' di fargli notare in modo preciso che sta inviando valori che nel tempo variano in modo eccessivo.

Share this post


Link to post
Share on other sites
Rapace
7 hours ago, Lonewolf said:

Tutto chiaro, grazie!

Due valori, media e scostamento dalla media sono esattamente quel che serve, mi sembra.

 

 

I numeri da analizzare li ricevo; si tratta di un flusso settimanale che per ciascun articolo contiene le previsioni settimana per settimana per un numero di settimane futuro che puo' arrivare fino ad un anno (ma a chi riceve interessa la somma dei primi 3 mesi e, in minor misura, dei 3 successivi.

 

Come i valori siano stimati e' un problema di chi li invia ... evidentemente non li stima molto bene, visto che il problema nasce appunto dalla necessita' di fargli notare in modo preciso che sta inviando valori che nel tempo variano in modo eccessivo.

 

Trattandosi di stime, si tratta di serie aleatorie (non deterministiche).

Ovvero... non sono numeri certi.

Un numero certo (che si è verificato) si puo' chiamare xmentre un numero stimato sarà xi+n + u(dove uè una variabile aleatoria, che per restare sul pratico non puo' essere prevista).

Ora... dato che nessuno ha la "palla di cristallo" si possono solo trovare dei metodi che garantiscano che uabbia certe caratteristiche (o che per lo meno vi si avvicini).

udovrebbe avere media zero e varianza 1 :) (ma qui il ragionamento è complesso ma cerco di semplicare con un concetto.... banalmente se unon avesse media zero ma media m, si dovrebbe modificare il modello di previsione aggiungendo m alle previsioni per migliorarle).

Se non è cosi'... vol dire che non hai "spiegato" bene cosa "compone" la variabile xi e quindi è rimasto "qualcosa" in uche in realtà è spiegabile e non "casuale" (ovvero "imprevedibile").

 

Che bello rivangare nelle mie conoscenze accademiche :).

 

Quando si ha un bel numero di dati storici, si possono utilizzare per fare previsioni in base a quello che è successo nel passato (un esempio è la stagionalità). 

Le "regole" (mamma mia che semplificazione, ma qui non stiamo facendo accademia) d'oro sono 2:

 

- Piu' ampio è il campione, migliori sono le stime che si possono ottenere.

- Piu' in la si stima nel tempo (se si trattano serie temporali) e piu' aumenta il margine di incertezza (si capisce anche "intuitivamente" credo).

 

Per fare le stime sul futuro, si possono utilizzare le serie storiche + altri elementi noti (altre serie di dati che rappresentano altri fenomeni).

Poi... una volta che il tempo passa, si avranno dati deterministici per il tempo che da futuro è diventato passato... e quindi si puo' inserire il valore deterministico realizzatosi nel modello e ricalcolare le previsioni future.

Se il modello originario è "buono" questo avrà impatto minimo (per lo meno nelle previsioni vicine), se il modello non è buono..... le previsioni saranno sempre di scarsa qualità.

 

 

Share this post


Link to post
Share on other sites
Lonewolf

Utile!

Grazie ...

 

:thumbsup:

  • Like 1

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this  

×