Diagramma a violino
Un diagramma a violino è una rappresentazione statistica utile per confrontare le distribuzioni di probabilità. È simile a un diagramma a scatola e baffi, con l'aggiunta di un grafico della densità del kernel ruotato su ciascun lato. [1]
Storia
[modifica | modifica wikitesto]Il diagramma a violino è stato proposto nel 1997 da Jerry L. Hintze e Ray D. Nelson per visualizzare informazioni aggiuntive rispetto ai diagrammi a scatola e baffi (detti anche box plot), creati da John Tukey nel 1977.[2] Il nome deriva dalla somiglianza della rappresentazione grafico con il corpo di un violino.[2]
Descrizione
[modifica | modifica wikitesto]I diagrammi a violino sono simili ai box plot, tranne per il fatto che mostrano anche la densità di probabilità dei dati a valori diversi, solitamente livellati da uno stimatore della densità del kernel. Un diagramma a violino include tutti i dati contenuti in un box plot: un indicatore per la mediana dei dati, una casella o un indicatore che indica l'intervallo interquartile, ed eventualmente tutti i punti campione, se il numero di campioni non è troppo elevato.
Mentre un box plot mostra statistiche riassuntive come media/mediana e intervalli interquartile, il diagramma a violino mostra la distribuzione completa dei dati. Il diagramma a violino può essere utilizzato in dati multimodali: in tal caso un diagramma a violino mostra la presenza di diversi picchi, la loro posizione e la relativa ampiezza.
Come i box plot, i diagrammi a violino vengono utilizzati per rappresentare il confronto di una distribuzione variabile (o distribuzione campione) tra diverse "categorie": ad esempio, la distribuzione della temperatura rispetto al giorno e alla notte, o la distribuzione dei prezzi delle auto rispetto a diversi produttori di automobili.
Un diagramma a violino può avere più livelli: ad esempio, la forma esterna rappresenta tutti i possibili risultati. Il livello successivo all'interno potrebbe rappresentare i valori che si verificano il 95% delle volte, il livello successivo all'interno potrebbe rappresentare i valori che si verificano il 50% delle volte, e così via.
I diagrammi a violino sono meno popolari dei box plot, possono essere più difficili da comprendere per i lettori che non li conoscono. In questo caso, un'alternativa più accessibile è tracciare una serie di istogrammi impilati o distribuzioni della densità del kernel.
Note
[modifica | modifica wikitesto]- ^ itl.nist.gov, http://www.itl.nist.gov/div898/software/dataplot/refman1/auxillar/violplot.htm .
- ^ a b (EN) Jerry L. Hintze e Ray D. Nelson, Violin Plots: A Box Plot-Density Trace Synergism, in The American Statistician, vol. 52, n. 2, May 1998, pp. 181–184, DOI:10.1080/00031305.1998.10480559, ISSN 0003-1305 .
Voci correlate
[modifica | modifica wikitesto]Altri progetti
[modifica | modifica wikitesto]- Wikimedia Commons contiene immagini o altri file su Diagramma a violino
Collegamenti esterni
[modifica | modifica wikitesto]- Componente aggiuntivo Vioplot per Stata
- Violinplot da un set di dati di grandi dimensioni con la libreria di visualizzazione statistica Seaborn basata su matplotlib