音乐信号时频分析 (英语:Time–frequency analysis for music signals )为时频分析 应用之一。音乐声音可以比人声更加复杂,占用更宽的频带,音乐信号为随时间变化的信号,只使用单纯的傅立叶变换 无法清楚分析,所以利用时间-频率分析做更有效的分析工具。时频分析为传统傅立叶变换延伸版。短时距傅立叶变换 、加伯转换 与维格纳分布 最被广泛使用之时频分析方法,对于分析音乐信号也相当管用。
音乐为在一个时间周期内具有稳定频率的声音,音乐可以通过几种方法来产生,例如,钢琴的声音由撞击琴弦产生的,小提琴的声音由弯曲琴弦产生的。所有音乐的声音都有其基频与色彩,基本频率是谐波系列的最低频率,在一个周期信号,基频为周期长度的倒数,而泛音的频率是基频的整数倍。在音乐理论 里,音准代表对声音感知的基频,然而实际的基频可能因感知基频的不同而不同。
图1 "Chord.wav"的波型[哪里?]
图2 "Chord.wav"之加伯转换
图3"Chord.wav"之频谱图
短时距傅立叶变换为时频分析之基本类型,如果有一个连续的信号x (t ),我们可以从下方等式计算短时距傅立叶变换
S
T
F
T
{
x
(
t
)
}
≡
X
(
t
,
f
)
=
∫
−
∞
∞
x
(
τ
)
w
(
t
−
τ
)
e
−
j
2
π
f
τ
d
τ
{\displaystyle \mathbf {STFT} \left\{x(t)\right\}\equiv X(t,f)=\int _{-\infty }^{\infty }x(\tau )w(t-\tau )e^{-j2\pi f\tau }\,d\tau }
w (t ) 為一窗函數 ,當 w (t )為方波時, 此轉換被稱為離散之方波短時距傅立葉變換 。當 w (t ) 為高斯函數 時, 此轉換被稱為加伯轉換。
一般的音乐信号通常为不连续信号,所以无法使用公式去计算离散之方波短时距傅立叶变换,将原本型式改为
X
(
n
Δ
t
,
m
Δ
f
)
=
∑
p
=
n
−
Q
n
+
Q
x
(
p
Δ
t
)
e
−
j
2
π
p
m
Δ
t
Δ
f
Δ
t
{\displaystyle X(n\,\Delta t,m\,\Delta f)=\sum _{p=n-Q}^{n+Q}x(p\,\Delta t)e^{-j2\pi pm\,\Delta t\,\Delta f}\,\Delta t}
令
t
=
n
Δ
t
{\displaystyle t=n\,\Delta t}
,
f
=
m
Δ
f
{\displaystyle f=m\,\Delta f}
,
τ
=
p
Δ
t
{\displaystyle \tau =p\,\Delta t}
,
B
=
Q
Δ
t
{\displaystyle B=Q\,\Delta t}
.
短时距傅立叶变换有些限制如下
Δ
t
Δ
f
=
1
N
,
{\displaystyle \Delta t\,\Delta f={\frac {1}{N}},}
,N'为整数
N
≥
2
Q
+
1
{\displaystyle N\geq 2Q+1}
Δ
<
1
2
f
max
{\displaystyle \Delta <{\frac {1}{2f_{\max }}}}
,
f
max
{\displaystyle f_{\max }}
为最高频率
s
p
e
c
t
r
o
g
r
a
m
(
t
,
f
)
=
|
S
T
F
T
(
t
,
f
)
|
2
{\displaystyle \mathbf {spectrogram} (t,f)=\left|\mathbf {STFT} (t,f)\right|^{2}}
虽然频谱图非常有用,但仍然有一个缺点,频率刻度为线性,但是音阶频率的变动为对数成长。
维格纳分布亦可用来分析音乐信号,其优点为高清晰度,但是需要高度计算,并具有交叉项的问题,所以它更适合于在同一时间内,并且不超过一个频率的状况下分析信号。
W
x
(
t
,
f
)
=
∫
−
∞
∞
x
(
t
+
τ
/
2
)
x
∗
(
t
−
τ
/
2
)
e
−
j
2
π
τ
f
d
τ
,
{\displaystyle \mathbf {W} _{x}(t,f)=\int _{-\infty }^{\infty }x(t+\tau /2)x^{*}(t-\tau /2)e^{-j2\pi \tau \,f}\,d\tau ,}
x (t )为其原讯号。