Se conosciamo il significato di Quartile e più genericamente di Percentile, possiamo avventurarci nella realizzazione dei GRAFICI BOXPLOT CON EXCEL.
Scopriamo insieme, passo dopo passo quanto affascinante possa essere il “dare forma” a degli indici numerici, comunicandone agli altri il loro significato intrinseco.
Si tratta di un tipo di grafico molto affascinante, capace di sintetizzare in un unico prospetto molte importanti informazioni. Il risultato del lavoro svolto in questo articolo sarà il seguente:
1 – INTERVALLO INTERQUARTILE
Di particolare interesse sarà il calcolo di una misurazione legata alla differenza tra il Q3 ed il Q1 che si definisce Intervallo Interquartile.
Quest’ultimo indice, per sua natura, è particolarmente robusto: non è influenzato da quei valori estremi che vengono definiti “Outliers”.
Il significato dell’Intervallo Interquartile è simile a quello della deviazione standard: maggiore è il suo valore tanto più variabile può essere considerata una distribuzione.
Possiamo usare i dati generati nell’articolo in cui abbiamo scoperto i Percentili ed i Quartili con Excel. Per procedere nella lettura si raccomanda di leggere con attenzione l’articolo di cui al link.
2 – OUTLIERS
Possiamo determinare se un valore sia così atipico da essere definito un Outlier.
Per essere un Outlier, un valore deve trovarsi “oltre” dei valori di limite individuabili tramite i quartili e gli Intervalli Interquartili definiti come IQR.
Possiamo calcolare infatti il limite inferiore e superiore per l’individuazione degli Outlier con le seguenti formule:
- Limite Inferiore = Q1 – (1,5 * IQR)
- Limite Superiore = Q3+ (1,5 * IQR)
I valori che cadono sotto il limite inferiore e sopra al limite superiore possono essere considerati degli Outlier.
Nelle figure sottostanti sono state nascoste le righe dei valori analizzati, dalla 3 alla 33 comprese, per lasciare lo spazio necessario alla visualizzazione delle sintesi.
Diamo subito uno sguardo alle formule utilizzate:
E adesso vediamo i risultati:
Nel nostro caso non esistono degli “Outliers” veri e propri in quanto sia i minimi che i massimi delle distribuzioni ricadono entro i limiti.
La Mediana, il primo ed il terzo quartile sono robusti ai valori di picco, ma non ci forniscono una indicazione su quali siano i valori di minimo e di massimo della distribuzione a cui appartengono.
Per una corretta analisi statistica dovremmo poter avere una rappresentazione grafica dei seguenti Valori di Interesse:
- MINIMO
- Q1
- MEDIANA
- Q3
- MASSIMO
3 – GRAFICI BOXPLOT CON EXCEL
Il grafico che permette di analizzare contemporaneamente le voci di interesse si chiama GRAFICO BOXPLOT.
L’ultima versione di Excel permette di realizzare in automatico il grafico ma ad oggi sono molte gli utilizzatori dei fogli di calcolo che possiedono versioni precedenti.
Vediamo adesso realizzare il grafico step by step, indipendentemente dalla versione del software. Potremo così meglio comprendere il vero significato di quello che stiamo realizzando.
Immaginiamo di mettere in colonna, una sopra all’altro, i valori dei quartili. Avremmo una torre, che blocco per blocco, sarà del seguente aspetto:
La zona che copre l’intervallo Q1-Q3 comprende la Mediana (che coincide con Q2) ed è robusta ai picchi.
Le zone residue sono le più influenzate dagli “Outliers” e non saranno rappresentate come “superfici” colorate nel BOXPLOT, ma da dei segmenti.
Per realizzare il grafico dobbiamo posizionare nel giusto ordine i valori che ci serviranno.
3.1 – DEFINIZIONE DEI BLOCCHI
Procederemo individuando le altezze di quelli che definiamo BLOCCHI:
Partendo dalla figura precedente andiamo a ricavare la tabella che ci serve per realizzare il grafico. I valori di base da cui ricavare tutto sono i seguenti:
- MIN
- Q1
- Q2
- Q3
- MAX
Andremo così a realizzare la tabella che segue con le formule specificate in prima colonna (da notare che iniziamo dalla colonna G):
3.2 – GRAFICI BOXPLOT CON EXCEL: INIZIAMO CON UN GRAFICO A PILA
Selezioniamo i valori presenti nella zona arancione ed ineriamo un Grafico a Colonne in Pila:
Si ottiene il seguente grafico:
Con un click sx del mouse selezioniamo la parte inferiore delle pile, quella azzurra
Con un click destro del mouse selezioniamo la voce “Formato serie di Dati”
Scegliamo la voce “nessun riempimento” dal menu Formato serie di Dati:
3.3 – GRAFICI BOXPLOT CON EXCEL: LE BARRE DI ERRORE
Facciamo click sulla parte Arancione
Seguiamo i menù come da immagine seguente
Clicchiamo su “Altre Opzioni” e poi su “Personalizzato” e “Specifica Valore”
Otteniamo
Seguiamo adesso le figure con estrema attenzione per capire cosa selezionare per i valori di errore:
- Selezioniamo per primi i Valori di Errore Positivi, quelli cioè che stanno nella parte superiore della pila
- Selezioniamo adesso i valori che stanno nella parte inferiore della pila, ovvero i Valori di Errore Negativi
Ecco il risultato:
3.4 – GRAFICI BOXPLOT CON EXCEL: I NOMI ALLE SERIE DI DATI
Diamo adesso i nomi alle serie ed alla legenda. Click destro su grafico e poi seleziona dati
Clicchiamo su Modifica della sezione “Etichette asse orizzontale”:
e poi
Selezioniamo adesso le celle da cui prendere il nome delle Etichette:
Confermando vediamo con sia possibile ottenere dei bellissimi Grafici BoxPlot con Excel:
Se hai trovato interessante questo articolo potresti provare a leggere anche:
- Excel-dati-n-elementi-scrivere-tutte-le-combinazioni-con-ripetizioni-possibili
- Excel-media-mediana-e-moda
- Excel-come-fare-un-grafico
- Excel-confrontare-due-elenchi
- Excel-come-eliminare-le-righe-vuote
- Excel-importare-un-file-csv-in-excel
Potresti inoltre trovare utili i seguenti corsi:
- Corso di WordPress
- Corso Excel Avanzato
- Corso Intensivo WordPress
- Corso di Analisi dei Dati con Excel
L’autore di questo è Gabriele di Ruvo, appassionato di informatica e dell’utilizzo di Excel come insostituibile strumento di Analisi dei Dati.