小提琴图
外观
小提琴图是一种用于比较几率分布的统计图形。它与箱形图类似,但在两侧多了翻转的核密度估计图。[1]
历史
[编辑]小提琴图由 Jerry L. Hintze 和 Ray D. Nelson 于1997年提出,作为比箱形图提供更多资讯的一种方法,而箱形图由John Tukey于1977年发明。[2] 名称来源于图形的形状类似于小提琴。[2]
介绍
[编辑]小提琴图与箱形图相似,不同的是它还显示了不同值下数据的几率密度函数,通常透过核密度估计平滑显示。小提琴图包含所有箱形图的资讯,例如数据的中位数标记;表示四分位距的框或标记;如果样本数不多,还可能包含所有样本点。
虽然箱形图显示的是平均数或中位数及四分位范围等统计摘要,但小提琴图显示的是数据的完整分布。小提琴图可用于具有多峰分布的数据(即具有多个峰值)。在这种情况下,小提琴图显示不同峰值的存在、位置及相对幅度。
与箱形图一样,小提琴图用来比较不同类别变量的分布(或样本分布),例如比较白天和夜晚的温度分布,或者比较不同汽车制造商之间的汽车价格分布。
小提琴图可以具有多层结构。例如,外层形状代表所有可能的结果。下一层内的图形可能代表95%发生的值,接下来的内层可能代表50%发生的值。
小提琴图不如箱形图流行。对于不熟悉小提琴图的读者来说,理解可能会比较困难。在这种情况下,可以使用更容易理解的替代方法,如绘制一系列堆叠的直方图或核密度估计图。
小提琴图的原始含义是箱形图和双侧核密度图的结合。[1] 然而,现在“小提琴图”有时被理解为仅包含双侧核密度图,而不包含箱形图或其他元素。[3][4]
相关条目
[编辑]参考文献
[编辑]- ^ 1.0 1.1 Violin Plot. NIST DataPlot. National Institute of Standards and Technology. 2015-10-13.
- ^ 2.0 2.1 Hintze, Jerry L.; Nelson, Ray D. Violin Plots: A Box Plot-Density Trace Synergism. The American Statistician. May 1998, 52 (2): 181–184. ISSN 0003-1305. doi:10.1080/00031305.1998.10480559 (英语).
- ^ Wilke, Claus O. Fundamentals of Data Visualization.
- ^ Violin plot — geom_violin. ggplot2.tidyverse.org. [2023-11-19] (英语).
外部链接
[编辑]- Vioplot add-in for Stata
- 使用宽格式数据集绘制小提琴图 使用基于matplotlib的统计可视化库 seaborn
本条目引用的公有领域材料来自国家标准技术研究所的文档《Dataplot reference manual: Violin plot》。