跳转到内容

倒频谱

本页使用了标题或全文手工转换
维基百科,自由的百科全书
倒频谱的范例

倒频谱cepstrum),顾名思义,就是将频谱(spectrum)的英文前四个字母反过来写。倒频谱是为了某些时候,为了计算方便,将原来信号的频谱先转成类似分贝的单位,再作逆傅里叶变换,把它视为一种新的讯号做处理。倒频谱有复数倒频谱,及实数倒频谱。

倒频谱被定义在1963的论文(Bogert等)。定义如下:

  • 字义:倒频谱(信号)是信号频谱取对数的傅立叶变换后的新频谱(信号),有时候会称频谱的倒频谱。
  • 数学上:信号的倒频谱 = IFT ( log ( | FT (信号) | ) + j2πm )(m为实数)
  • 演算法:信号 -> 傅立叶变换 -> 取绝对值 -> 取对数 -> 相位展开 -> 逆傅立叶变换 -> 倒频谱

复数倒频谱拥有频谱大小跟相位的资讯,实数倒频谱只有频谱大小的资讯,各有各的不同应用。

复数倒频谱与实数倒频谱

[编辑]

复数倒频谱

[编辑]


其中
可能遭遇的问题
1.
2. 有无限多的解
当输入是实数时,因为偶对称奇对称,所以复数倒频谱的值为实数

实数倒频谱

[编辑]


可能遭遇的问题
1.

应用

[编辑]
  • 倒频谱可以被视为在不同频带上变化速率的资讯,倒频谱一开始被发明在地震炸弹产生的地震回音,现今也被使用在分析雷达讯号,以及讯号处理等问题。
  • 自相关倒频谱(autocepstrum)被定义为倒频谱的自相关性,自相关倒频谱有时在分析处理回传讯号时比倒频谱还准确。
  • 倒频谱在处理人声讯号以及音乐讯号有非常好的效果,例如梅尔频率倒频谱(Mel-Frequency Cepstrum),用来做声音的辨认,侦测音高等。近年来梅耳倒频谱也被应用在音乐资讯的回复。
  • 倒频谱在声学中可以将声带震动的影响去除。
  • 倒频谱用在处理多路径问题时(如声波回音电磁波的折、反射等),如果将其他路径干扰视为杂讯,为了消除杂讯,利用倒频谱,不需测量每条多路径的延迟时间,可以利用传送多次信号,观察其他路径在倒频谱上的效果,并且加以滤除。
  • 语音大致上是由音高、声带脉冲、声门波形所组成,我们可以利用倒频谱将这三种元素在倒频域上分开,以利于做语音讯号的分析。
  • 倒频谱的微分适用于影像处理上的图形辨认(pattern recognition)。
  • 倒频谱与同型声音理论(homomorphic sound theory)有关。

倒频谱观念

[编辑]

频谱图上的独立变数是频率,而倒频谱图上的独立变数为倒频率(quefrency),倒频率是一种时间的度量单位。举个例子,声音讯号取样速率等于44100赫兹,在倒频谱上有个很大的值在倒频率等于100,代表实际上在44100/100=441赫兹有很大的值,这值出现在倒频谱上因为频谱上周期性出现,而频谱上出现的周期与倒频谱很大的值出现的位置有关。

倒滤波器

[编辑]

滤波器(filter)常使用在频谱上,用来保存或删除我们所要或不要的资讯,经过上面的许多讨论,不难猜到,倒滤波器(lifter)就是在倒频谱上所使用的滤波器。低通的倒滤波器跟低通滤波器有点类似,它可以借由在倒频谱上乘以一个window系数,使倒频谱上的高倒频率被压抑,如此依来,当信号转回时域空间时会变成一个较平滑的信号。

计算倒频谱的方法

[编辑]

直接计算IDTFT(反离散时间傅立叶变换)

[编辑]


问题: 可能会无限大, 且对于arg(x[n])有无限多个解

利用Z转换的零点与极点

[编辑]

先对信号做Z转换, 并整理一下系数, 让他变成下面的形式

其中

分子:
第一项A是系数
第二项是延迟
第三项是位于单位圆内的零点
第四项是位于单位圆外的零点

分母:
第一项是位于单位圆内的极点
第二项是位于单位圆外的极点

取log变成

假设r=0, 因为这只是延迟, 并不会破坏波形
根据Z转换所得到的系数, 我们可以利用泰勒展开得到Z的反转换


注意事项
1.总是IIR(无限脉冲响应)
2.对于FIR(有限脉冲响应)的情况,

利用Z转换与微分

[编辑]



对其做Z的反转换




分别对于x[n]的四种不同的状况做延伸
1.对于x[n]是因果(causal)和最小相位(minimum phase) i.e.
对于
可得出



2.对于x[n]是最小相位(minimum phase)

3.对于x[n]是反因果(anti-causal)且最大相位(maximum phase) i.e.

4.对于x[n]是最大相位(maximum phase)

特性

[编辑]

1. 复数倒频谱至少以的速度衰退

其中
2. 如果X(Z)没有在单位圆以外的零点和极点, 则

因为
3. 如果X(Z)没有在单位圆以内的零点和极点, 则

因为
4. 如果x[n]是有限长度, 则是无限长度

同态解卷积的应用(Application of Homomorphic Deconvolution)

[编辑]

同态解卷积有非常多应用面,尤其是在声学工程和语音分析方面的实用性

(1) 回声的均衡化

其中是接收到的讯号,是原始讯号,是延迟的样本数,是衰减系数
是脉冲响应,描述原始讯号与回声讯号之间的关系
,其中是单位脉冲函数
系统函数
透过对系统函数进行对数转换,简化回声成分的分析和处理
转换到时域

(2) 声学工程

,其中是合成音乐,是原始音乐,是脉冲响应(例如建筑物空间的影响)

(3) 语音分析

透过在complex cepstrum domain中进行滤波,分离这些成分,使得对语音讯号的理解和处理更为精确。
,其中是语音波,是全局波形,是声道脉冲,是音高,*是卷积

(4) 地震信号分析

(5) 任意波传播的多路径分析

梅尔频率倒频谱

[编辑]

梅尔频率倒频谱是倒频谱的一种应用,梅尔频率倒频谱常应用在声音讯号处理,对于声音讯号处理比倒频谱更接近人耳对声音的分析特性,而梅尔频率倒频谱与倒频谱的差别在于:

  1. 梅尔频率倒频谱的频带分析是根据人耳听觉特性所设计,人耳对于频率的分辨能力,是由频率的"比值"决定,也就是说,人耳对200赫兹和300赫兹之间的差别与2000赫兹和3000赫兹之间的差别是相同的。
  2. 梅尔频率倒频谱是针对讯号的能量对数,而倒频谱是针对讯号原始在频谱上的值取对数
  3. 梅尔频率倒频谱是使用离散馀弦转换,倒频谱是用离散傅立叶变换
  4. 梅尔频率倒频谱系数足够描述语音的特征。


梅尔频率倒频谱系数(MFCCs)的推导步骤:

  1. 将信号做傅立叶变换
  2. 频谱上的值取绝对值再平方成为能量,在乘上频谱上对应的梅尔频率倒频谱三角重叠窗(window)的系数。
  3. 对每个梅尔频率取对数
  4. 离散馀弦转换
  5. 求得梅尔频率倒频谱系数。

梅尔频率倒频谱应用

[编辑]
  • 梅尔频率倒频谱系数常利用在辨认语音技术上,例如辨认电话中说话的人的身份。
  • 利用每种乐风、或乐器在梅尔频域上有不同特性来分析音乐的种类与类型,并且可以加以分类。

杂讯敏感性

[编辑]

梅尔频率倒频谱系数很容易被外来的杂讯所破坏,因此有些研究结果指出,在求梅尔频率倒频谱系数时,在作离散馀弦转换前,提升适当的能量(大约2或3倍),以减少杂讯在低能量成份的影响。

梅尔频率倒频谱优点

[编辑]

相较于原始的倒频谱

  • 有绝对值平方

卷积

[编辑]

倒频谱领域上的一项重要的特性为二信号卷积之产生,其产生之程序为二倒频谱值(cepstra)之相加:



微分倒频谱(differential cepstrum)

[编辑]

定义

[编辑]


If




优点: (a)没有模糊的相位 (b)可以处理延迟问题

特性

[编辑]

(1)微分倒频谱在shift和scaling时,结果不改变。
ex:

(proof):



(2)复数倒频谱 与 微分倒频谱 和原讯号x[n]有关
diff cepstrum
recursive formula
复数频谱做得到的事情, 微分倒频谱也做得到
(3)如果x[n]是最小相位(minimum phase),则,当
minimum phase 意思为 no poles 或 zeros 在单位圆外
(4)如果x[n]是最大相位(maximum phase),则,当
maximum phase 意思为 no poles 或 zeros 在单位圆内
(5)如果x(n)为有限区间,则为无限区间

  • 复数倒频谱的衰减率反比于n
  • 微分倒频谱的衰减率下降


范例

[编辑]
  • ,otherwise 0 , Find its cepstrum.



step 1. Z transform:
step 2. log:
step 3. reverse Z transform:

  • ,otherwise 0 , Find its inverse cepstrum.



step 1. Z transform:
step 2. exp:
step 3. reverse Z transform:

  • Suppose that an IIR filter is



step 1. Z transform:
step 2. log:
step 3. reverse Z transform:



参考文献

[编辑]
  1. B. P. Bogert, M. J. R. Healy, and J. W. Tukey: "The quefrency analysis of time series for echoes: cepstrum, pseudo-autocovariance, cross-cepstrum, and saphe cracking". Proceedings of the Symposium on Time Series Analysis (M. Rosenblatt, Ed) Chapter 15, 209-243. New York: Wiley, 1963.
  2. D. G. Childers, D. P. Skinner, R. C. Kemerait, "The Cepstrum: A Guide to Processing页面存档备份,存于互联网档案馆)," Proceedings of the IEEE, Vol. 65, No. 10, October 1977, pp. 1428-1443.
  3. Jian-Jiun Ding, Advanced Digital Signal Processing class note,the Department of Electrical Engineering, National Taiwan University (NTU), Taipei, Taiwan, 2008
  4. Jian-Jiun Ding, Advanced Digital Signal Processing class note,the Department of Electrical Engineering, National Taiwan University (NTU), Taipei, Taiwan, 2024