Скрипкова діаграма
Скрипкова діаграма — це метод відображення числових даних. Це схоже на коробковий графік, з додаванням оберненого графіку щільності ядра з кожного боку.[1]
Скрипкова діаграма подібна до коробкових графіків, за винятком того, що вона також показує густину ймовірності даних при різних значеннях, зазвичай згладжених за допомогою ядрової оцінки густини. Зазвичай скрипкова діаграма включатиме всі дані, що містяться в графіку: маркер для медіани даних; коробка або маркер, що вказує на міжквартильний діапазон; і, можливо, всі точки відбору, якщо кількість зразків не надто велика.
Скрипкова діаграма є більш інформативною, ніж звичайний графік. У той час як коробковий графік відображає лише зведені статистичні дані, такі як середнє / середнє та міжквартильні діапазони, скрипкова діаграма показує повний розподіл даних. Різниця особливо корисна, коли розподіл даних мультимодальний (більше одного піку). У цьому випадку скрипкова діаграма показує наявність різних піків, їх положення та відносну амплітуду.
Як і коробкові графіки, скрипкові діаграми використовуються для представлення порівняння варіативного розподілу (або розподілу вибірки) за різними «категоріями» (наприклад, розподіл температури в порівнянні між днем і ніччю, або розподіл цін на автомобіль у порівнянні по різним виробникам автомобілів).
Скрипкова діаграма може мати кілька шарів. Наприклад, зовнішня форма представляє всі можливі результати. Наступний шар всередині може представляти значення, які трапляються 95 % випадків. Наступний шар (якщо він існує) всередині може представляти значення, які трапляються 50 % випадків.
Хоча вони більш інформативні, ніж коробковий графік, вони менш популярні. Через непопулярність їх значення важче зрозуміти багатьом читачам, не знайомим із скрипковим поданням даних. У цьому випадку більш доступною альтернативою може бути побудова серії послідовно розташованих гістограм або розподілу густини ядра.
Скрипкові діаграми доступні як розширення для ряду програмних пакетів, включаючи R-пакети vioplot, wvioplot, caroline, UsingR, lattice та ggplot2, команду надбудови Stata vioplot,[2] та у мові програмування Python бібліотеки matplotlib[3], Plotly[en][4], ROOT[5] та Seaborn[6], тип графіка у Origin[7], IGOR Pro[en][8], пакет статистичних графіків Julia StatsPlots.jl[9] та DistributionChart [Архівовано 18 січня 2021 у Wayback Machine.] у Mathematica.
- ↑ Violin Plot. NIST DataPlot. National Institute of Standards and Technology. 13 жовтня 2015. Архів оригіналу за 30 жовтня 2020. Процитовано 2 грудня 2020.
- ↑ Hintze, Jerry L.; Nelson, Ray D. (1998). Violin Plots: A Box Plot-Density Trace Synergism. The American Statistician. 52 (2): 181—4. doi:10.1080/00031305.1998.10480559. Архів оригіналу за 22 березня 2021. Процитовано 2 грудня 2020.
- ↑ violin plots. What's new in matplotlib. Архів оригіналу за 12 серпня 2020. Процитовано 2 грудня 2020.
- ↑ Violin Plots in Python. Plotly Python API Library Reference. Архів оригіналу за 28 грудня 2019. Процитовано 2 грудня 2020.
- ↑ The Violin option. Архів оригіналу за 30 жовтня 2020. Процитовано 5 травня 2020.
- ↑ Waskom, Michael. Violinplot from a wide-form dataset. Seaborn: statistical data visualization. Архів оригіналу за 8 лютого 2021. Процитовано 2 грудня 2020.
- ↑ Violin Plot in Origin 2019. Архів оригіналу за 22 вересня 2018. Процитовано 29 жовтня 2018.
- ↑ Igor Pro 8 Highlights. Wavemetrics. Архів оригіналу за 14 серпня 2020. Процитовано 28 липня 2019.
- ↑ boxplot, dotplot, and violin. Архів оригіналу за 12 листопада 2020. Процитовано 15 серпня 2020.
- Vioplot add-in for Stata [Архівовано 2 грудня 2020 у Wayback Machine.]
- Violinplot from a wide-form dataset [Архівовано 8 лютого 2021 у Wayback Machine.] with the seaborn [Архівовано 3 грудня 2020 у Wayback Machine.] statistical visualization library based on matplotlib
- Dataplot reference manual: Violin plot [Архівовано 30 жовтня 2020 у Wayback Machine.]