以盒狀圖 與概率密度函數展示的正態分佈 N (0, σ 2 ) .
概率密度函數 (P robability d ensity f unction,簡寫作PDF [ 1] ,在不致於混淆時可簡稱為密度函數 )是描述隨機變量 的輸出值,在某個確定的取值點附近的可能性的函數 。圖中,橫軸為隨機變量的取值,縱軸為概率密度函數的值,而隨機變量的取值落在某個區域內的概率為概率密度函數在這個區域上的積分 。當概率密度函數存在的時候,累積分佈函數 是概率密度函數的積分。概率密度函數有時也被稱為概率分佈函數,但這種稱法可能會和累積分佈函數 (CDF)或概率質量函數 (PMF)混淆。一般來說,PMF 用於離散隨機變量(在可數集上取值的隨機變量),而 PDF 用於連續隨機變量。
對於一維實隨機變量X ,設它的累積分佈函數是
F
X
(
x
)
{\displaystyle F_{X}(x)}
。如果存在可測函數
f
X
(
x
)
{\displaystyle f_{X}(x)}
,滿足:
∀
−
∞
<
a
<
∞
,
F
X
(
a
)
=
∫
−
∞
a
f
X
(
x
)
d
x
{\displaystyle \forall -\infty <a<\infty ,\quad F_{X}(a)=\int _{-\infty }^{a}f_{X}(x)\,dx}
那麼X 是一個連續型隨機變量,並且
f
X
(
x
)
{\displaystyle f_{X}(x)}
是它的概率密度函數。[ 2]
連續型隨機變量的概率密度函數有如下性質:
∀
−
∞
<
x
<
∞
,
f
X
(
x
)
≥
0
{\displaystyle \forall -\infty <x<\infty ,\quad f_{X}(x)\geq 0}
∫
−
∞
∞
f
X
(
x
)
d
x
=
1
{\displaystyle \int _{-\infty }^{\infty }f_{X}(x)\,dx=1}
∀
−
∞
<
a
<
b
<
∞
,
P
[
a
<
X
≤
b
]
=
F
X
(
b
)
−
F
X
(
a
)
=
∫
a
b
f
X
(
x
)
d
x
{\displaystyle \forall -\infty <a<b<\infty ,\quad \mathbb {P} \left[a<X\leq b\right]=F_{X}(b)-F_{X}(a)=\int _{a}^{b}f_{X}(x)\,dx}
如果概率密度函數
f
X
(
x
)
{\displaystyle f_{X}(x)}
在一點
x
{\displaystyle x}
上連續 ,那麼累積分佈函數可導 ,並且它的導數 :
F
X
′
(
x
)
=
f
X
(
x
)
{\displaystyle F_{X}^{\prime }(x)=f_{X}(x)}
由於隨機變量X 的取值
P
[
a
<
X
≤
b
]
{\displaystyle \mathbb {P} \left[a<X\leq b\right]}
只取決於概率密度函數的積分,所以概率密度函數在個別點上的取值並不會影響隨機變量的表現。更準確來說,如果一個函數和X 的概率密度函數取值不同的點只有有限個、可數無限個或者相對於整個實數軸來說測度為0(是一個零測集 ),那麼這個函數也可以是X 的概率密度函數。
連續型的隨機變量取值在任意一點的概率都是0。作為推論,連續型隨機變量在區間上取值的概率與這個區間是開區間還是閉區間無關。要注意的是,概率
P
[
X
=
a
]
=
0
{\displaystyle \mathbb {P} \left[X=a\right]=0}
,但
{
X
=
a
}
{\displaystyle \{X=a\}}
並不是不可能事件。[ 2]
連續型均勻分佈的概率密度函數
最簡單的概率密度函數是均勻分佈 的密度函數。對於一個取值在區間
[
a
,
b
]
{\displaystyle [a,b]}
上的均勻分佈函數
I
[
a
,
b
]
{\displaystyle \mathbf {I} _{[a,b]}}
,它的概率密度函數:
f
I
[
a
,
b
]
(
x
)
=
1
b
−
a
I
[
a
,
b
]
{\displaystyle f_{\mathbf {I} _{[a,b]}}(x)={\frac {1}{b-a}}\mathbf {I} _{[a,b]}}
也就是說,當x 不在區間
[
a
,
b
]
{\displaystyle [a,b]}
上的時候,函數值等於0,而在區間
[
a
,
b
]
{\displaystyle [a,b]}
上的時候,函數值等於
1
b
−
a
{\displaystyle \scriptstyle {\frac {1}{b-a}}}
。這個函數並不是完全的連續函數,但是是可積函數。
正態分佈的概率密度函數
正態分佈 是重要的概率分佈。它的概率密度函數是:
f
(
x
)
=
1
σ
2
π
e
−
(
x
−
μ
)
2
2
σ
2
{\displaystyle f(x)={1 \over \sigma {\sqrt {2\pi }}}\,e^{-{(x-\mu )^{2} \over 2\sigma ^{2}}}}
隨着參數
μ
{\displaystyle \mu }
和
σ
{\displaystyle \sigma }
變化,概率分佈也產生變化。
隨機變量X的n階矩 是X的n次方的期望值 ,即
E
[
X
n
]
=
∫
−
∞
∞
x
n
f
X
(
x
)
d
x
{\displaystyle \mathbb {E} [X^{n}]=\int _{-\infty }^{\infty }x^{n}f_{X}(x)\,dx}
X的方差 為
σ
X
2
=
E
[
(
X
−
E
[
X
]
)
2
]
=
∫
−
∞
∞
(
x
−
E
[
X
]
)
2
f
X
(
x
)
d
x
{\displaystyle \sigma _{X}^{2}=\mathbb {E} \left[\left(X-\mathbb {E} [X]\right)^{2}\right]=\int _{-\infty }^{\infty }(x-E[X])^{2}f_{X}(x)\,dx}
更廣泛的說,設
g
{\displaystyle g}
為一個有界 連續 函數,那麼隨機變量
g
(
X
)
{\displaystyle g(X)}
的數學期望值
E
[
g
(
X
)
]
=
∫
−
∞
∞
g
(
x
)
f
X
(
x
)
d
x
{\displaystyle \mathbb {E} [g(X)]=\int _{-\infty }^{\infty }g(x)f_{X}(x)\,dx}
[ 3]
對概率密度函數作類似傅立葉變換 可得特徵函數 。
Φ
X
(
j
ω
)
=
∫
−
∞
∞
f
(
x
)
e
j
ω
x
d
x
{\displaystyle \Phi _{X}(j\omega )=\int _{-\infty }^{\infty }f(x)e^{j\omega x}\,dx}
特徵函數與概率密度函數有一對一的關係。因此,知道一個分佈的特徵函數就等同於知道一個分佈的概率密度函數。[ 4]