Siamo abituati a parlare di metodologia Six Sigma. Forse ripetiamo queste parole così spesso da non soffermarci quasi sui singoli termini. Pertanto ho deciso di dedicare un articolo a ciò che dà il nome a questa nostra disciplina, ovvero sigma ( σ ).
Sigma è ovviamente la lettera esse dell’alfabeto greco, ma quale origine ha quando ne parliamo in ambito Six Sigma? Cos’è sigma ( σ )? A cosa serve veramente sigma ( σ )?
Tanto per cominciare il nostro discorso, diciamo che il contesto da cui perviene sigma ( σ ) così come lo intendiamo noi, è la statistica descrittiva. La statistica si divide in statistica inferenziale, relativa al calcolo delle probabilità, e statistica descrittiva, che è, invece, relativa agli indici.
Da questa definizione capiamo che il nostro sigma ( σ ) è quindi un indice statistico e, nei paragrafi seguenti, specificheremo cos’è, a cosa serve, le due formule di calcolo, la relazione con la varianza (sigma quadro) e la curva a campana di Gauss, il calcolo con Excel, Minitab e R, la differenza tra deviazione standard campionaria e deviazione standard della popolazione.
INDICE
1] sigma (σ): introduzione al concetto
2] tutti i nomi di sigma (σ)
3] sigma ( σ ) | deviazione standard | SQM scarto quadratico medio
come siamo abituati a vederlo in metodologia Six Sigma
-la curva a campana di Gauss e la distribuzione in percentuale
-Curtosi
4] sigma ( σ ) | deviazione standard | SQM scarto quadratico medio: cos’e’ introduzione al concetto
5] calcolo sigma ( σ ) | deviazione standard | SQM scarto quadratico medio, esempi
-serie di valori
-frequenze di valori
-media ponderata
-esempio di calcolo della media ponderata
6] come si calcola sigma ( σ ) | deviazione standard | SQM scarto quadratico medio?
le due formule di calcolo di sigma ( σ ) | deviazione standard | SQM scarto quadratico medio
7] legame tra sigma ( σ ) | deviazione standard | SQM scarto quadratico medio ed il concetto di varianza
8] come calcolare sigma ( σ ) | deviazione standard | SQM scarto quadratico medio con Excel
tabella per la definizione del campione
9] conclusioni su utilizzo di sigma ( σ ) | deviazione standard | SQM scarto quadratico medio nel confronto tra piu’ lotti con la stessa media
10] qual e’ il valore ottimale sigma ( σ ) | deviazione standard | SQM scarto quadratico medio?
11] rappresentazione grafica di media e sigma ( σ ) | deviazione standard | SQM scarto quadratico medio tramite interval plot
12] i due valori di sigma ( σ ) | deviazione standard | SQM scarto quadratico medio: deviazione standard della popolazione e deviazione standard campionaria
-che differenza c’è tra deviazione standard della popolazione e deviazione standard campionaria?
-cosa significa correzione di Bessel? formule
-perche’ per calcolare la deviazione standard campionaria e’ necessario ricorrere a n-1?
-perche’ la deviazione standard campionaria e’ piu’ grande della deviazione standard della popolazione?
-comandi di calcolo per deviazione standard della popolazione e deviazione standard campionaria su Excel
13] come calcolare sigma ( σ ) | deviazione standard | SQM scarto quadratico medio con Minitab?
-calcolo di sigma ( σ ) | deviazione standard | SQM scarto quadratico medio con funzionalita’ statistics di Minitab
-grafico istogramma e calcolo deviazione standard | sigma ( σ ) | SQM scarto quadratico medio con Minitab
-capability analysis e calcolo deviazione standard | sigma ( σ ) | SQM scarto quadratico medio con Minitab
14] come calcolare sigma ( σ ) | deviazione standard | SQM scarto quadratico medio con R
esempio di calcolo di sigma ( σ ) | deviazione standard | SQM scarto quadratico medio su R
15] deviazione standard della popolazione e deviazione standard campionaria: quale ottengo dai vari software
16] perche’ sigma ( σ ) | deviazione standard | SQM scarto quadratico medio non puo’ mai essere negativo
17] a cosa serve sigma ( σ ) | deviazione standard | SQM scarto quadratico medio?
applicazioni di sigma ( σ ) | deviazione standard | SQM scarto quadratico medio
18] scarica il file: dati FTSE MIB marzo 2019 e marzo 2020
esempio di calcolo sigma ( σ ) | deviazione standard | SQM scarto quadratico medio
19] …per riassumere
1] SIGMA (σ) INTRODUZIONE AL CONCETTO
Come abbiamo anticipato, per inquadrare sigma ( σ ) dobbiamo interpellare la statistica descrittiva, che studia e classifica gli indici come segue:

Nello schema dobbiamo fare caso a due cose:
- sigma ( σ ) rientra negli indici di dispersione
- un altro indice ha lo stesso simbolo di sigma ( σ ), è elevato al quadrato e si chiama varianza
Torneremo a breve su questi concetti perché sono fondamentali.
2] TUTTI I NOMI DI SIGMA (σ)
Onde evitare confusione, diciamo che sigma ( σ ) è conosciuto anche come “deviazione standard”, “sqm – scarto quadratico medio” ed “errore standard”.
Nei paragrafi a seguire lo troverete indicato con tutti e tre i nomi oppure anche solamente come “deviazione standard”, con l’abbreviazione “ds”, o con l’abbreviazione inglese “sd”.
3] SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO
COME SIAMO ABITUATI A VEDERLO IN METODOLOGIA SIX SIGMA
Questa si potrebbe definire l’immagine iconica della metodologia Six Sigma.
Cosa rappresenta?
Rappresenta la curva a campana di Gauss con i valori che ne rappresentano i tratti salienti, ovvero μ (mi) e σ.
La lettera μ (mi) indica la media, ovvero la bisettrice della curva, e sigma ( σ ) rappresenta la distanza tra la media e il punto di flesso della curva.
Karl Friedrich Gauss è stato un grande matematico tedesco e, alla base della curva che porta il suo nome, c’è un fatto empirico: una popolazione infinita di misurazioni di eventi del tutto casuali tendono ad assumere una configurazione a “campana”, detta di “tipo normale”.
L’area sottostante la campana è ≃ 1, valore che, nella teoria della probabilità rappresenta la certezza.
La curva di Gauss prende anche il nome di curva degli errori.
La seguente immagine rappresenta la curva di Gauss con le percentuali di concentrazione in corrispondenza di sigma ( σ ) e suoi multipli.
LA CURVA A CAMPANA DI GAUSS E LA DISTRIBUZIONE IN PERCENTUALE

In Fig.2 vediamo la rappresentazione grafica della distribuzione: il 68.27% dei casi “cade” nel raggio di 2 sigma ( σ ) dalla media, il 95.45% “cade” nel raggio di 4 sigma ( σ ) dalla media e il 99.73% (la totalità al netto di uno scarto irrilevante) “cade” nel raggio di 6 sigma ( σ ) dalla media.
Per fare un esempio di applicazione pratica, la curva di Gauss ci dice che, se misurassimo, ad esempio, il livello di istruzione della popolazione Italiana, oppure lo sport praticato, od anche il livello dei trigliceridi nel sangue, i valori si centrerebbero ed avrebbero il loro massimo intorno alla media e presenterebbero una deviazione standard sigma ( σ ).
Ovviamente la curva a campana di Gauss può essere può meno schiacciata
CURTOSI
Ciò che ci dice quanto la curva a campana di Gauss sia più o meno schiacciata è l’indice di Curtosi che, come vedete nella Fig.1, è, appunto, un indice di forma.
Se l’indice di Curtosi è positivo, la campana sarà molto stretta e allungata, quindi tutti i valori saranno molto vicini alla media.
Se l’indice di Curtosi è nullo, la campana sarà piuttosto regolare, quindi tutti i valori saranno vicini alla media.
Se l’indice di Curtosi è negativo, la campana sarà molto schiacciata e larga, quindi tutti i valori saranno molto distanti alla media.

Più la gaussiana è schiacciata più grande è sigma e meno la media è rappresentativa, ovvero tanto più sigma ( σ ) cresce, tanto più i dati analizzati si discostano dalla media.
4] SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO: COS’E’ INTRODUZIONE AL CONCETTO
Cos’è dunque sigma ( σ ) | deviazione standard | SQM scarto quadratico medio?
Per rispondere alla domanda ci riallacciamo ai concetti chiave dei paragrafi precedenti, in cui abbiamo utilizzato queste definizioni:
variabilità
indice di dispersione
deviazione standard
sqm scarto quadratico medio
errore standard
curva degli errori
serie di dati da analizzare
media
Tra i concetti elencati i due fattori chiave sono media e dispersione/scostamento.
Dunque, facendo una summa, possiamo dire che sigma ( σ ) | deviazione standard | SQM scarto quadratico medio è un indice statistico di dispersione che risponde alle domande:
Quanto, ognuno dei nostri dati, si discosta dalla media dei dati stessi?
Qual è l’errore di ognuno dei nostri dati rispetto alla media dei dati stessi?
Qual è la dispersione ognuno dei nostri dati rispetto alla media dei dati stessi?
Quanto ognuno dei nostri dati è variabile rispetto alla media dei dati stessi?
5] CALCOLO SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO, ESEMPI
Per capire veramente di cosa stiamo parlando può essere utile un esempio pratico numerico di come si calcola il nostro indice sigma ( σ ) | deviazione standard | SQM scarto quadratico medio.
Dunque, cosa ci serve per calcolare sigma ( σ ) | deviazione standard | SQM scarto quadratico medio?
- una serie di valori
- la frequenza dei valori
SERIE DI VALORI
Una serie di valori è un elenco di dati numerici da analizzare. Ad esempio il peso delle mele nell’esempio seguente.
FREQUENZE DI VALORI
Cos’è la frequenza di un valore? E’ semplicemente il numero di volte in cui quel valore si presenta.
Per esempio, in un’azienda abbiamo 2 dirigenti, 3 quadri, 10 impiegati e 70 operai.
La frequenza del valore dirigente è 2, la frequenza del valore quadro è 3, e così via.
Cosa ci serve innanzitutto per calcolare sigma ( σ ) | deviazione standard | SQM scarto quadratico medio? Ci serve calcolare la media aritmetica ponderata dei nostri valori.
MEDIA PONDERATA
Si definisce media ponderata quella in cui moltiplichiamo un valore per la propria frequenza.
ESEMPIO DI CALCOLO DELLA MEDIA PONDERATA
Supponiamo di avere un certo numero di mele da analizzare.
Nella colonna centrale sono riportati i valori statistici xi da analizzare, nella colonna di destra sono riportare le frequenze ni corrispondenti .
Nel nostro esempio le frequenze ni sono tutte pari ad uno perché i valori xi (peso delle mele) sono presenti solo una volta.
Facendo la somma delle ni otteniamo N, ovvero il numero di campioni totali, che nel nostro esempio è 5.
Il che significa che analizzeremo 5 mele di cui 1 pesa 217 grammi, 1 pesa 228 grammi, 1 pesa 180 grammi, ecc.
Se, ad esempio, ci fossero state più mele con lo stesso peso, la nostra tabella sarebbe, per esempio, così:
Facendo la somma delle ni otteniamo N, ovvero il numero di campioni totali, in questo secondo esempio è 15.
I valori della colonna ni non sono più tutti uguali ad 1, il che significa che ora analizzeremo 15 mele di cui 2 pesano 217 grammi, 1 pesa 228 grammi, 5 pesano 180 grammi, ecc.
La formula della media ponderata è

applicandola al primo esempio con 5 mele avremo
applicandola al primo esempio con 15 mele avremo
A questo punto possiamo procedere al calcolo di sigma ( σ ) | deviazione standard | SQM scarto quadratico medio.
6] COME SI CALCOLA SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO?
LE DUE FORMULE DI CALCOLO DI SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO
Per calcolare sigma ( σ ) | deviazione standard | SQM scarto quadratico medio abbiamo a disposizione due formule: la formula “tradizionale” e quella “ridotta“.
La formula “tradizionale” è
che, applicata ai nostri dati con 5 mele, si traduce in questi numeri
La formula “ridotta” viene così chiamata perché è leggermente più snella dal punto di vista computazionale, ed è questa
applicata ai nostri dati abbiamo
Come potete constatare i risultati sono ovviamente identici.
Fate molta attenzione ad inserire la frequenza nella formula!
7] LEGAME TRA SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO ED IL CONCETTO DI VARIANZA
Per parlare del legame tra sigma ( σ ) | deviazione standard | SQM scarto quadratico medio, mi rifaccio alla Fig.1 raffigurante la classificazione degli indici statistici:
vedete che tra gli indici di dispersione sotto sigma ( σ ) | deviazione standard | SQM scarto quadratico medio, ovvero σ , c’è un altro indice che si chiama varianza ed è caratterizzato dal simbolo σ2 ?
Possiamo quindi dire che, data la nostra formula, se ne facciamo la radice quadrata, troviamo σ, se la lasciamo allo stato originale, abbiamo σ2
Ovvero semplicemente questo:
8] COME CALCOLARE SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO CON EXCEL
Nel precedente paragrafo abbiamo visto come si calcola sigma ( σ ) | deviazione standard | SQM scarto quadratico medio con carta, penna e calcolatrice, ora vediamo come si calcola con Excel.
Supponiamo di essere coltivatori di mele. Per poter essere immesse sul mercato, le mele devono rispettare determinate caratteristiche.
Supponiamo che tra queste ci sia il peso.
Dunque andremo ad esaminare un campione rappresentativo delle nostre mele per valutarne l’aderenza ai parametri di qualità stabiliti.
Per la definizione del campione vi rimando alla seguente tabella (fonte qualitapa.gov.it)
TABELLA PER LA DEFINIZIONE DEL CAMPIONE

Nel nostro fondo abbiamo due campi dedicati alla produzione delle mele, il campo “blu” e il campo “arancione”.
Vogliamo confrontare i prodotti dei due campi e vedere a quale appartengano le mele più appetibili rispetto al parametro che abbiamo scelto precedentemente, cioè il peso.
Supponiamo che, attendendoci alla tabella Fig.4, 5 mele siano un campione rappresentativo della nostra coltivazione.
Iniziamo dunque a scegliere in maniera casuale 5 mele prodotte nel campo “blu” e le pesiamo.
Vediamo che la media dei loro pesi è 200 grammi.
Adesso procediamo in maniera analoga con 5 mele prodotte nel campo “arancione”.
Anche in questo caso, vediamo che la media dei pesi è esattamente 200 grammi.
Il fatto che le loro medie siano identiche potrebbe condurci alla conclusione che i due lotti siano assolutamente equipollenti e di equal valore. Ma siamo sicuri che sia così? Quale indice può darci una indicazione del valore dei due lotti?
Visto che abbiamo legato il concetto di sigma ( σ ) | deviazione standard | SQM scarto quadratico medio a quello di errore, volatilità, scostamento, proviamo a calcolare la deviazione standard | sigma ( σ ) | SQM scarto quadratico medio dei due lotti, campo “blu” e campo “arancione”, questa volta con Excel.
Seguite i seguenti brevi video per visualizzare i comandi di calcolo della media e di sigma ( σ ) | deviazione standard | SQM scarto quadratico medio.
Iniziamo dalle mele del campo blu:
Video1
Come potete vedere i risultati sono gli stessi trovati con la calcolatrice ai punti 5] e 6] ovvero media=200; ds=18,96
Adesso visioniamo i calcolo relativi alle mele del campo arancione:
Video2
Come già sapevamo, anche in questo caso la media=200
Abbiamo trovato una ds=4,05 nettamente inferiore a quella alle mele del campo blu.
Quale conclusione ne dobbiamo trarre? Quali sono le mele più adatte al mercato?
Visto che abbiamo legato il concetto di sigma ( σ ) | deviazione standard | SQM scarto quadratico medio a quello di errore, scostamento, dispersione, possiamo sicuramente dedurre che le mele del campo arancione sono le migliori perché hanno un sigma ( σ ) | deviazione standard | SQM scarto quadratico medio inferiore a quello delle mele del campo blu.
Possiamo vedere in questo semplice prospetto come, infatti, gli scostamenti dalla media delle mele del campo arancione siano notevolmente più bassi di quelli delle mele del campo blu:

9] CONCLUSIONI SU UTILIZZO DI SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO NEL CONFRONTO TRA PIU’ LOTTI CON LA STESSA MEDIA
Possiamo quindi dire che, in riferimento al parametro peso, le mele del campo arancione, a parità di media, sono migliori perché hanno un
sigma ( σ ) | deviazione standard | SQM scarto quadratico medio inferiore.
ll lotto di mele del campo blu oscilla nel range di 18,96 dalla media, mentre il lotto del campo arancione oscilla solamente nel range di 4,05 dalla media.
Se sigma ( σ ) | deviazione standard | SQM scarto quadratico medio è basso, la media rappresenta bene la variabile studiata (le nostre mele).
Se sigma ( σ ) | deviazione standard | SQM scarto quadratico medio è basso, i dati sono poco dispersi rispetto alla media che è il punto centrale.
10] QUAL E’ IL VALORE OTTIMALE SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO?
Visto che abbiamo detto che sigma ( σ ) | deviazione standard | SQM scarto quadratico medio è una misura di errore/scostamento/dispersione dalla media e che tanto minore è meglio è.
Questo ci porta alla conclusione che il valore ideale di sigma ( σ ) | deviazione standard | SQM scarto quadratico medio medio è zero.
11] RAPPRESENTAZIONE GRAFICA DI MEDIA E SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO TRAMITE INTERVAL PLOT
Vi presento il grafico interval plot creato con il software Minitab 19 per rendere ancora più chiaro il confronto tra i nostri due lotti di mele.
Questo tipo di grafico è utilissimo per vedere come i valori oggetto di studio si estendano allontanandosi dalla media (rappresentata con il pallino).
Sono gli stessi dati indicati nella Fig.5 colonna a destra. Il grafico ci mostra chiaramente come i valori del lotto “campo arancione” siano molto più compatti di quelli del lotto “campo blu”.
12] I DUE VALORI DI SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO: DEVIAZIONE STANDARD DELLA POPOLAZIONE E DEVIAZIONE STANDARD CAMPIONARIA
Sicuramente nei video precedenti vi siate accorti che, inserendo il comando del calcolo di sigma ( σ ) | deviazione standard | SQM scarto quadratico medio, Excel propone più opzioni.
Io ho selezionato questa:

L’altra opzione che potete utilizzare è questa:

Si possono utilizzare entrambe ma, per scegliere, dobbiamo conoscere la differenza tra sigma ( σ ) | SQM scarto quadratico medio | deviazione standard della popolazione (Fig.6) e sigma ( σ ) | SQM scarto quadratico medio | deviazione standard campionaria (Fig.7).
CHE DIFFERENZA C’E’ TRA DEVIAZIONE STANDARD DELLA POPOLAZIONE E DEVIAZIONE STANDARD CAMPIONARIA?
La deviazione standard della Popolazione calcola la deviazione standard per una popolazione intera di campioni, ovvero: ho 100.000 mele e le analizzo tutte.
La deviazione standard Campionaria calcola la deviazione standard su un campione degli elementi da analizzare.
E’ l’esatto caso dei nostri campi di mele, dove non abbiamo pesato tutte le mele ma ne abbiamo scelte 5 per campo, un campione di di 5 mele, per l’appunto. A livello matematico utilizza la correzione di Bessel (n-1).
COSA SIGNIFICA CORREZIONE DI BESSEL? FORMULE DEVIAZIONE STANDARD DELLA POPOLAZIONE E DEVIAZIONE STANDARD CAMPIONARIA

Le due formule a confronto rispondono alla domanda: la Correzione di Bessel è semplicemente la riduzione del denominatore da N a N-1. Ricordiamo che N rappresenta la popolazione campionaria, ovvero tutti gli elementi da analizzare.
PERCHE’ PER CALCOLARE LA DEVIAZIONE STANDARD CAMPIONARIA E’ NECESSARIO RICORRERE A N-1?
N-1 si usa per indicare un campione che è una parte (quindi più piccolo) dell’intera popolazione che è indicata con N.
Le formule della Fig.8, ci offrono lo spunto per un’altra domanda:
PERCHE’ LA DEVIAZIONE STANDARD CAMPIONARIA E’ PIU’ GRANDE DELLA DEVIAZIONE STANDARD DELLA POPOLAZIONE?
Semplicemente perché il denominatore della formula è più piccolo.
Possiamo constatarlo con questo semplice esempio:
Per tornare al nostro esempio delle mele, possiamo riepilogare dicendo che sigma ( σ ) | deviazione standard | SQM scarto quadratico medio della popolazione calcolato nel Video1 è 18,96 mentre sigma ( σ ) | deviazione standard | SQM scarto quadratico medio campionario è….
Video3
…è 21,20 > 18,96 c.v.d.
COMANDI DI CALCOLO PER DEVIAZIONE STANDARD DELLA POPOLAZIONE E DEVIAZIONE STANDARD CAMPIONARIA SU EXCEL
I comandi per calcolare sigma ( σ ) | deviazione standard | SQM scarto quadratico medio su Excel possono cambiare a seconda delle versioni del programma, quindi potreste trovare
deviazione standard della popolazione:
DEV.ST.POP oppure DEV.ST.P
deviazione standard campionaria:
DEV.ST oppure DEV.ST.C
13] COME CALCOLARE SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO CON MINITAB?
Voglio proporvi un esempio di calcolo di sigma ( σ ) | deviazione standard | SQM scarto quadratico medio con Minitab, che è il software per eccellenza della metodologia Lean Six Sigma. Quella utilizzata è la release 19.
Come dati da analizzare, vi propongo un report vero estratto da hyperion Genesys.
Si tratta delle chiamate ricevute in una giornata, divise per fasce orarie. Supponiamo di essere interessati a vedere quale siano la media delle chiamate del giorno e la deviazione standard delle varie fasce orarie rispetto alla media del giorno.

CALCOLO DI SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO CON FUNZIONALITA’ STATISTICS DI MINITAB
Carichiamo i nostri dati (evidenziati in verde nella Fig.9) nel worksheet di Minitab, come fosse un foglio di Excel:
folder Calc -> opzione Column Statistics
selezionate Standard deviation
cliccate su C1 numero chiamate che diventerà blu
il campo Input variable si completerà della voce C1 numero chiamate
date l’OK
e vi apparirà il valore della deviazione standard: 307,855
GRAFICO ISTOGRAMMA E CALCOLO DEVIAZIONE STANDARD | SIGMA ( σ ) | SQM SCARTO QUADRATICO MEDIO CON MINITAB
Vediamo ora la funzionalità del folder Graph che ci permetterà di disegnare i nostri dati (io ho scelto l’istogramma) e calcolare sigma ( σ ) | deviazione standard | SQM scarto quadratico medio.
Seguite le indicazioni in viola sulle seguenti schermate:
Ed ecco il nostro grafico con media e deviazione standard:
CAPABILITY ANALYSIS E CALCOLO DEVIAZIONE STANDARD | SIGMA ( σ ) | SQM SCARTO QUADRATICO MEDIO CON MINITAB
Per finire, vediamo la funzionalità del folder Assistant che ci permetterà di effettuare la Capabilty Analysis dei nostri dati.
Ricordiamo che la Capabilty Analysis è l’analisi dell’adeguatezza di un processo.
Seguite le indicazioni in viola sulle seguenti schermate:
Ed ecco che visualizziamo grafico, media e deviazione standard | sigma ( σ ) | SQM scarto quadratico medio
14] COME CALCOLARE SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO CON R
ESEMPIO DI CALCOLO DI SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO SU R
Vediamo infine il calcolo di sigma ( σ ) | deviazione standard | SQM scarto quadratico medio con il software R, che è il software per antonomasia per l’analisi statistica dei dati:
I dati si inseriscono secondo la struttura di R ovvero x=c (………)
Per calcolare la media si scrive mean(x) e poi si dà invio.
Per calcolare la deviazione standard si scrive sd(x) e poi si dà invio.
Ricordate che i comandi di R sono sempre in Inglese.
Potete chiamare la vostra incognita con qualsiasi lettera, non è obbligatorio chiamarla x. Basta che la dicitura sia uguale in tutte le query che andrete a lanciare.
Come potete vedere i dati di R sono uguali a quelli di Minitab.
Abbiamo però detto che ci sono due tipi di deviazione standard | sigma ( σ ) | SQM scarto quadratico medio, quella della popolazione e quella campionaria.
Con Excel siamo noi a scegliere (vd. Video1, Video2, Video3) ma Minitab ed R propongono una soluzione sola. Quale sarà?
15] DEVIAZIONE STANDARD DELLA POPOLAZIONE E DEVIAZIONE STANDARD CAMPIONARIA: QUALE OTTENGO DAI VARI SOFTWARE
Per rispondere alla domanda, vi propongo questa tabella riassuntiva:
strumento / software | ds popolazione | ds campionaria |
calcolatrice | X | |
Excel | X | X |
Minitab | X | |
R | X |
16] PERCHE’ SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO NON PUO’ MAI ESSERE NEGATIVO
La varianza è un indice quadratico, infatti il suo simbolo è σ2, ricordate? Quindi, a prescindere da qualsiasi altra considerazione, non può essere negativo.
Ogni volta che in matematica estraiamo una radice quadrata, diciamo che il risultato è ± un certo valore. Verrebbe spontaneo asserirlo anche quando parliamo di σ, visto che è la radice quadrata della varianza.
Perché asseriamo allora che deviazione standard | sigma ( σ ) | SQM scarto quadratico medio non può essere negativo?
Per rispondere ci rifacciamo al suo significato, che è quello di dispersione, che per definizione, non può essere negativo.
17] A COSA SERVE SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO?
APPLICAZIONI DI SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO
Per riscontrare l’applicazione e l’utilità di deviazione standard | sigma ( σ ) | SQM scarto quadratico medio ci rifacciamo ai concetti di scostamento ed errore.
Viene infatti applicato per l’analisi degli scostamenti da un parametro.
Ad esempio, in ambito finanziario, viene usato per indicare la differenza tra rendimenti attesi e reali (payoff ) di un’attività finanziaria. In questo caso la misura della volatilità dell’attività finanziaria ci indica il suo livello di rischio.
In ambito sportivo è utilizzato per valutare le prestazioni di un atleta.
In ambito aziendale è utilizzato per valutare la capacità di un processo produttivo.
E’ basilare per il controllo di qualità. Ad esempio nel nostro esempio della coltivazione di mele, tutte le mele, per potere essere immesse sul mercato, dovranno avere lo stesso peso.
18] SCARICA IL FILE: DATI FTSE MIB MARZO 2019 E MARZO 2020
ESEMPIO DI CALCOLO SIGMA ( σ ) | DEVIAZIONE STANDARD | SQM SCARTO QUADRATICO MEDIO
Per finire questa lungo articolo su deviazione standard | sigma ( σ ) | SQM scarto quadratico medio vi allego un file scaricabile.
Riporta i dati del Ftse MIB dei primi 19 giorni di Marzo 2019 e Marzo 2020 di cui ho calcolato sigma ( σ ) – deviazione standard – SQM scarto quadratico medio. Provate a fare i calcoli anche voi e verificate l’enorme differenza dei due risultati.
Il valore di quest’anno è circa 10 volte quello dell’anno scorso e ciò è perfettamente coerente con la situazione che stiamo vivendo.
Ricordate che in finanza deviazione standard alta=volatilità alta=rischio alto
19] …PER RIASSUMERE
Definizione, formula, significato
sigma ( σ ) è un indice statistico di dispersione. è conosciuto anche come “deviazione standard”, “sqm – scarto quadratico medio” ed “errore standard”.


Avendo una serie di valori, risponde alla domanda: Qual è la dispersione ognuno dei nostri dati rispetto alla media dei dati stessi?
Se, per esempio, abbiamo una serie di valori il cui sigma ( σ ) è 4,05, significa che i valori oscillano nel range di 4,05 dalla media.

Valore ideale
Dal momento che è una misura di errore/scostamento/dispersione da un parametro scelto (in genere la media) tanto minore è meglio è. Questo ci porta alla conclusione che il valore ideale di sigma ( σ ) | deviazione standard | SQM scarto quadratico medio medio è zero.
Relazione con la varianza (sigma quadro σ2 )
sigma ( σ ) | deviazione standard | SQM scarto quadratico medio è la radice quadrata della varianza (sigma quadro σ2 )
Deviazione standard della Popolazione e deviazione standard Campionaria
La deviazione standard della Popolazione calcola la deviazione standard per una popolazione intera di campioni, ovvero: ho 100.000 mele e le analizzo tutte.
La deviazione standard Campionaria calcola la deviazione standard su un campione degli elementi da analizzare. A livello matematico utilizza la correzione di Bessel (n-1).
strumento / software | ds popolazione | ds campionaria |
calcolatrice | X | |
Excel | X | X |
Minitab | X | |
R | X |
Utilizzi
Viene applicato per l’analisi degli scostamenti da un parametro.
Ad esempio, in ambito finanziario, viene usato per indicare la differenza tra rendimenti attesi e reali (payoff ) di un’attività finanziaria. In questo caso la misura della volatilità dell’attività finanziaria ci indica il suo livello di rischio.
In ambito sportivo è utilizzato per valutare le prestazioni di un atleta.
In ambito aziendale è utilizzato per valutare la capacità di un processo produttivo.
E’ basilare per il controllo di qualità.
Articolo davvero interessante utile e spiegato molto bene. Grazie Patrizia.
Grazie Stefano per il tuo intervento e il tuo apprezzamento del mio presentare sigma dal punto di vista statistico e computazionale.
Si parla di sigma in termini troppo generici lasciandone il concetto nella vaghezza.
Penso che mostrare l’ essenza dei concetti e il loro funzionamento, sia il modo migliore per dare risalto alla loro utilizzabilità.
Buongiorno, l’articolo è chiarissimo, grazie mille. Non ho una formazione statistica e se ho capito bene, nel valutare un processo aziendale, sigma deve essere il più basso possibile. Perchè nei livelli di sigma (errori per milione) il valore di sigma più basso è definito 6sigma e quello più alto 1sigma? Grazie!
Silvia
Buongiorno Silvia, grazie per i complimenti e per la sua domanda. Devo dire che lei sta anticipando molti argomenti e molti post… Vedo comunque di rispondere facendo riferimento a concetti già trattati.
Sì la deviazione standard (sigma) è una misura di errore/scostamento/difetto/variabilità/rischio. Pertanto, più è grande, peggiore è la situazione. Ne ho riportato un esempio nel file sul FTSE MIB, dove vediamo che sigma registrato in pieno coronavirus è ben 11 quello dello stesso periodo dell’anno scorso.
La metodologia Sei Sigma mira all’eliminazione dei difetti e degli sprechi nell’ ottica di ottimizzazione della qualità, e questo ci riconduce al concetto che la deviazione standard debba essere la più piccola possibile.
A quanto capisco, la sua domanda fa riferimento alla tabella di correlazione DPMO (defects per million opportunities) con sigma. Questa tabella, sì, si ferma al valore 6sigma che è quello corrispondente al DPMO 3,4 (obiettivo di minimizzazione di errori e difetti). La tabella, però, non parte dal valore sigma=1 ma dal valore sigma=0. Lei, probabilmente, ha trovato una tabella semplificata. WordPress non mi consente di allegare nulla nei commenti ma posso inviare la tabella via mail previa richiesta all’indirizzo: contatti@unovirgolasei.eu
La tabella, e i calcoli del DPMO, rispondono alla domanda: “a quanti sigma stiamo lavorando?” e in questa fase potrebbe causa di confusione.
Quindi, prima del discorso relativo alla correlazione DPMO->sigma, le propongo di concentrarsi a ragionare sulla “capacità del processo” (process capability), ovvero l’idoneità del processo a produrre nel rispetto dei requisiti. La process capability è misurata dagli indici di Cp e Cpk.
Ne ho riportato la formula al punto punto 21 del mio articolo sui processi aziendali https://unovirgolasei.eu/bpm-la-gestione-per-processi-aziendali/
Soffermiamoci sull’indice CP, che è dato dalla differenza tra i limiti di processo, superiore e inferiore, diviso per 6sigma, ovvero:
cp= (USL – SLS)/ 6*sigma
Poniamo di avere due processi, entrambi con limite superiore USL=22 e limite inferiore SLS=10. Il primo però ha sigma=8 e il secondo sigma=3
La pc del primo processo è (22-10)/6*8 = 0.25
quella del secondo processo è (22-10)/6*3 = 0.67, notevolmente più alta.
Da cui risulta appunto che sigma alto = process capability bassa.
Spero di aver risposto alla sua domanda o, comunque, averle fornito qualche strumento in più.
bravi, poche parole
Grazie, Francesco
Complimenti Patrizia, con questo articolo ho ripreso in modo semplice diversi concetti che avevo dimenticato e che mi torneranno utili nell’applicazione a casi più complessi.
Grazie mille, Elena
Brava, tutto espresso in modo semplice e chiaro. Cosa rara nei libri
Grazie Flavio. Il mio intento era proprio quello.
Articoli interessante e istruttivo, mi è capitato di leggere in questi giorni articoli climatici che parlano di evento sigma 5, in questo caso è un evento molto raro che si discosta di 5 volte sigma dalla media e che quindi si pone in una estremità della curva di Gauss. Mi chiedevo come si calcola la probabilità di un evento sigma 5 e se fosse indicatore di un errore nella scelta del modello matematico
Buongiorno Andrea, la ringrazio molto per i complimenti.
La metodologia 6sigma e il caso citato da lei sono due cose distinte anche se in entrambi i casi troviamo i concetti di:
curva di Gauss
sigma
probabilità
Cerchiamo innanzitutto di non confonderci.
Nella metodologia 6sigma siamo abituati a considerare l’area sottesa alla curva di Gauss, dove, più ci allontaniamo dalla media, più l’area sottesa alla curva aumenta arrivando a (sfiorare il) 100%.
Ricordiamo che l’area sottesa alla curva rappresenta la probabilità.
Per quanto riguarda il caso che cita lei, dobbiamo considerare la probabilità riferita ad ogni singolo livello di sigma. Succede che più ci si allontana dalla media, più le probabilità di accadimento diventano piccole, infatti lei ne ha sentito parlare in ambito di eventi rari.
Nel punto più alto della curva (dove x=media) la probabilità ha il suo massimo: 39,89%, in 5sigma la probabilità è 0,00003%.
Non potendo caricare allegati ai commenti, le mando via mail grafico delle probabilità per livello di sigma (fino a 3sigma) ed anche la formula distribuzione normale.
Ovviamente chiunque altro interessato può farmene richiesta qui nei commenti.