跳转到内容

离散型均匀分布

本页使用了标题或全文手工转换
维基百科,自由的百科全书
离散型均匀分布
概率质量函数
Discrete uniform probability mass function for n=5
n=5 where n=b-a+1
累积分布函数
Discrete uniform cumulative mass function for n=5
参数

值域
概率质量函数
累积分布函数
期望
中位数
众数 N/A
方差
偏度
峰度
矩生成函数
特征函数

统计学概率理论中,离散型均匀分布是离散型概率分布,其中有限个数值拥有相同的概率。离散型均匀分布的另一种说法为“有限个结果,各结果的概率均相同”。

像均匀的骰子就是离散型均匀分布的例子,可能的值为1, 2, 3, 4, 5, 6,而每一个数字的概率都是1/6。但若同时丢二个均匀骰子,将其值相加,就不是离散型均匀分布了,因为各个和的概率不同。 离散型均匀分布常用来描述结果为数字的分布,不过离散型均匀分布也可以描述结果是有限集合的分布。例如随机置换英语random permutation就是由已知长度的置换中均匀随机产生的组合,而均匀生成树英语uniform spanning tree是由给定的树中均匀随机产生的生成树

离散型均匀分布在本质上是非参数(non-parametric)的。不过要表示其值很容易,就用[a,b]之间的所有整数即可,因此ab就是离散型均匀分布的主要参数(也常常改为考虑区间[1,n],只保留一个参数n)。若用这种表示法,针对任意k ∈ [a,b]的累积分布函数(CDF)为

最大值估计

[编辑]

我们将会讨论德国坦克问题的例子,将最大值估计应用于二战期间德国坦克产量的估计。

设k 个观测值的样本是从一下整数的均匀分布中获得的: 而问题就是估计未知的最大 N。 最大值的均匀最小方差无偏 (UMVU) 估计量为下列式子:其中 m 是样本最大值,k 是样本大小,而且无放回抽样。 这可被看作为最大间距估计的一个非常简单的例子。

这个式子也有一个变样版本: 该式中的标准差被大约表示为,也就是样本之间差距的平均大小,与作比较。

样本最大值是总体最大值的最大似然估计,然而,该方法存在偏差。

若样本没有编号但可被识别或标记,则可透过捕获再捕获方法以估计族群规模。

随机排列

[编辑]

有关均匀分布随机排列的固定点数量的概率分布的说明,请参阅主条目。