跳至內容

Praat語音學軟件

維基百科,自由的百科全書
Praat語音學軟件
原作者保羅·布爾斯馬
大衛·韋寧克
首次發布1991年
當前版本6.4.23(2024年10月27日,​5天前​(2024-10-27[1]
源代碼庫 編輯維基數據鏈接
操作系統跨平台:
Macintosh, Windows, Linux, FreeBSD, SGI, Solaris, HPUX
語言英語
類型語言學軟件語音學
許可協議 編輯維基數據鏈接
網站www.fon.hum.uva.nl/praat/ 編輯維基數據

Praat語音學軟件,原名Praat: doing phonetics by computer,通常簡稱Praat,是一款跨平台的多功能語音學專業軟件,主要用於對數字化語音信號進行分析、標註、處理合成等實驗,同時生成各種語圖和文字報表。

背景概要

[編輯]

命名

[編輯]

Praat國際音標 [praːt][pʀaːt])在荷蘭語中是說話交談的意思,而doing phonetics by computer使用計算機研究語音學。作為軟件的名稱,常被稱作Praat語音學軟件

作者

[編輯]

Praat的作者是荷蘭阿姆斯特丹大學人文學院語音科學研究所的主席保羅·布爾斯馬(Paul Boersma)教授和大衛·韋寧克(David Weenink)助教授。

版本

[編輯]

Praat最早的版本發布於1993年。起初用戶還無法自由地下載使用,但從2003年6月5日的4.1版起,作者取消了專門的授權並開放了絕大部分源代碼。進一步,從2004年3月4日的4.2版起,作者開放了全部源代碼,使Praat成為採用GNU通用公共許可證授權的開源軟件。作者會時常發布修訂版本,消除舊的故障,增添新的功能。2007年12月10日發布了5.0版。[2]

Praat目前支持在多種計算機平台上運行,包括:

作者為以上平台的用戶提供已編譯好的目標文件。高級用戶還可以在其他操作系統平台上修改並編譯源代碼後運行Praat程序。

Praat能夠在圖形命令行兩種用戶界面下運行,但兩種界面的目標文件(可執行文件)各自獨立,以Windows版為例,即分為praat.exepraatcon.exe兩個可執行文件,其中後者只能通過命令行方式從控制台調用。

功能簡介

[編輯]

請注意:和維基百科中其他介紹軟件產品的條目一樣,本條目以下章節中對Praat的功能進行的簡要介紹僅供讀者參考,不可能也無意於代替由開發者提供的手冊文檔。

用途概述

[編輯]

Praat的主要功能是對自然語言語音信號進行採集分析標註,並執行包括變換濾波等在內的多種處理任務。作為分析結果的文字報表和語圖,不但可以輸出到個人計算機磁盤文件中和終端顯示器上,更能夠輸出為精緻的矢量圖位圖,供寫作和印刷學術論文與專著使用。

此外,Praat還可用於合成語音或聲音統計分析語言學數據輔助語音教學測試,等等。隨着新版本的發布,Praat的功能和用途仍在不斷擴展,但實際上多數用戶只需要用到一小部分功能。

構成與界面

[編輯]

Praat程序由外圍核心兩層構成。外圍主要包括對象窗口(Object window,標題為Praat objects)、畫板窗口(Picture window,標題為Praat picture)、腳本編輯器(ScriptEditor)、按鈕編輯器(ButtonEditor)、數據編輯器(DataEditor,無固定標題)、情報窗口(Info window)和手冊(Manual)等不負責具體的信號處理任務的輔助性組件。Praat每次啟動時,自動打開對象窗口和畫板窗口。對象窗口也是Praat的主控窗口,在Praat程序的會話進程中始終打開,大部分功能也需要由此展開。腳本(script)在是Praat中執行各種操作的宏命令,能夠簡化日常操作,減少出錯,並實現大量複雜操作的自動化。按照作者的最初設想,除了Praat之外還會有其他程序使用與Praat相同的外圍程序,但多年來一直沒有實現[4]

Praat的核心部分即具體負責語音信號處理任務的程序,包括所有的對象類型(Types of object)、動作命令(Action commands)和相應的編輯器(Editors)。對象(object)是由Praat程序所構建的數據存儲載體,有很多種類型,如聲音(Sound)、文本表格(TextGrid)、音高(Pitch)、變換(Manipulation),等等,通過執行編輯器或動態選單(Dynamic menu)中的動作命令完成對數據的查詢(數字化測量)和處理(生成新對象)任務。聲音編輯器(SoundEditor)和文本表格編輯器(TextGridEditor)是Praat中最常用的兩種編輯器,多用於涉及語音分析和標註的科學研究與課堂教學。

語音分析與標註

[編輯]

對語音信號的分析與標註是Praat的基本功能。在Praat中錄音或讀取音頻文件後,可以按用戶要求顯示以下多種語圖

  • 三維語圖(spectrogram)
  • 頻譜切片(spectral slices)
  • 音高(即基頻[5])曲線(pitch contour)
  • 共振峰曲線(formant contour)
  • 音強曲線(intensity contour)

所有的語圖都可以繪製成精緻的矢量圖,也可以將相應的對象數據保存為磁盤文件。除直觀的語圖外,Praat也能通過對信號數據的計算獲得各種文字情報,比如音高、時長、第一或第二共振峰頻率的數值等,也同樣可以根據需要輸出為適當的形式。

Praat允許用戶對語音數據進行標註,包括音段切分和文字注釋,標註的結果還可以獨立保存和交換。然而,Praat本身缺乏自動標註功能,只能對有聲段和靜默段進行簡單的識別,而不能對音節節拍群語流單位加以切分。[6]

其他功能

[編輯]

Praat還具有許多其他功能,包括:

其中某些功能的提供與軟件作者的研究興趣有關(例如「優選論學習」),很多不相關的用戶可能不會用到。

引文著錄

[編輯]

寫作學術論文或專著時如果用到Praat軟件,有必要在參考文獻中進行著錄。作者推薦的方式是[7]

Paul Boersma & David Weenink (2005):
Praat: doing phonetics by computer (Version 4.5.16) [Computer program].
Retrieved Feb 22, 2007, from http://www.praat.org/

如果不允許引用計算機程序,則改引另一處來源:

2001 PRAAT, a system for doing phonetics by computer.
     Glot International 5(9/10): 341-345.
     (These pages include a review by Vincent van Heuven.)

在漢語期刊中引用時,應另外酌情修改。

評價與影響

[編輯]

優點

[編輯]
  • 可以免費獲得而無需購買(因為是開源軟件)。
  • 無需安裝即可運行(但嚴格地說,還不是綠色軟件)。
  • 支持多種操作系統平台。
  • 支持用腳本宏命令和插件(plug-in)擴展和簡化操作。
  • 專業功能強大而完備。
  • 高級用戶可以按需修改源代碼並重新編譯,從根本上擴充原有功能。
  • 附有詳細的手冊文檔。

缺點

[編輯]
  • 分析程序採用的某些數字信號處理算法[8]仍然不盡如人意,會不可避免地造成迷惑人的假象或產生難以解釋的結果。
  • 不能直接訪問某些常用音頻和圖像文件格式,如WMA格式;對MP3格式的支持也僅限讀取(軟件許可證方面的原因)。
  • 由於最初並不是在Windows平台下開發的,用戶界面的設計和某些操作習慣可能會讓Windows用戶感到不便,比如沒有鼠標右鍵菜單,鍵盤按鍵名稱也是Macintosh機器的。
  • 目前尚無除英語以外其他語言的版本,部分用戶可能會遇到語言障礙。
  • 尚未全面支援Unicode。檔案名稱如果包含漢字,在Praat對象窗口中會被底線取代。在TextGrid對象中如果輸入漢字,屏幕上會顯示亂碼(但所儲存文本仍舊正常,只是顯示不出來)。標註時所使用的國際音標字型為SIL Doulos IPA 1993頁面存檔備份,存於網際網路檔案館),而非SIL推薦的Unicode 字型[9]

影響

[編輯]
  • 儘管還存在一些缺點和不足,畢竟瑕不掩瑜,Praat已成為全世界實驗語音學心理語言學語言教學語言調查自然語言處理等相關領域的高校教師、學生和其他研究人員普遍選用的專業軟件。
  • Praat的普及,終結了從事實驗語音學特別是聲學語音學[10]研究必須依賴價格昂貴的實驗儀器的時代,許多語音學實驗室不再使用各種陳舊的語圖儀,而僅僅配置有安裝了Praat等軟件的個人計算機和靈敏的麥克風作為必備的器材。
  • 部分Praat高級用戶公開發布自己編寫的腳本甚至插件,其中不乏實用性較高者,既擴充了軟件的功能,也擴大了影響。
  • 在中國大陸:儘管只有英語版本可用,許多高校的教師在語音學等相關課程上用Praat進行教學演示,在研究工作中自己使用並鼓勵學生克服語言障礙學習掌握Praat的基本功能。越來越多的學術論文和專著當中可以見到用Praat生成的語圖和文字報表。不過,總體而言,了解並能夠用好這一工具的專業人士還比較少。

參考書目

[編輯]

專門介紹Praat使用方法的著作,在世界範圍內也並不多見。在中國大陸,有些語音學研究者也作有非正式出版的講義,而正式出版的學術專著也可能特辟章節簡單講解,列舉如下(按出版日期先後排序):

  • Praat語音軟件使用手冊/熊子瑜(2004年現代語音學暑期講習班課程講義,有電子版)
  • 語音特徵分析和Praat軟件的使用/熊子瑜(2005年現代語音學暑期講習班課程講義,有電子版)
  • 語言、語音與技術/王士元,彭剛著.-上海:上海教育出版社,2006年8月(中國當代語言學叢書,ISBN 7-5444-0714-4)——第十二章,Praat簡介
  • 實驗語音學的基本原理與Praat軟件操作(2016 貝先明 向檸)

外部連結

[編輯]

官方資源

[編輯]

本文編撰的主要參考文獻即以下的官方網站內容[11]

第三方資源

[編輯]

許多有經驗的Praat用戶通過因特網發布自己編寫的使用教程、腳本和插件,但不一定允許免費自由下載(按資源類別和作者姓名拉丁字母/漢語拼音順序排序):

使用教程
視頻教程
腳本
插件

另外,在一些論壇網站開設的語音學專業版面上,也聚集了水平各異的Praat用戶(按論壇名稱漢語拼音排序):

腳註

[編輯]
  1. ^ Releases. Github. [3 September 2019]. (原始內容存檔於2017-01-24). 
  2. ^ 詳見What's new?(Praat手冊文檔)頁面存檔備份,存於網際網路檔案館)的全部記載。
  3. ^ 大約從4.6版起分成兩個版本,分別適用於Windows 95/98/NT4/ME系統與Windows 2000/XP/Vista系統。
  4. ^ 參看What's new?(Praat手冊文檔)頁面存檔備份,存於網際網路檔案館) 2005年9月1日4.3.21版更新說明的第2條。
  5. ^ 嚴格地講,音高是一個聽覺心理學概念,而基頻是一個物理學概念,但本文和Praat軟件的界面與文檔中將二者視為等同的概念術語,pitch大多翻譯作音高,而f0f0一律翻譯作基頻
  6. ^ 音節的概念對於不同語言不盡相同,即便是同一種語言,學術界也存在爭議。在工程實現中,具體的語種應用目的決定音節切分的標準和程序。節拍群等更不必說。因此,這類自動切分程序由各種語言的研究者和工程師提供可能更為合適。
  7. ^ 參看Paul Boersma's writings on the Praat program頁面存檔備份,存於網際網路檔案館)或FAQ: How to cite Praat(Praat在線幫助)頁面存檔備份,存於網際網路檔案館)。
  8. ^ 有關Praat軟件分析算法的詳細情況,可以參看Paul Boersma's writings on the Praat program頁面存檔備份,存於網際網路檔案館)所列文獻。
  9. ^ 參見官方網站的下載說明頁面存檔備份,存於網際網路檔案館)。Praat自3.2版開始使用SIL字型,沿襲至今。SIL Doulos IPA 1993頁面存檔備份,存於網際網路檔案館)是早期廣為使用的國際音標字型,但SIL已將其作廢頁面存檔備份,存於網際網路檔案館),改推薦Unicode的國際音標字型。在使用者討論群組曾有人詢問[失效連結]如何在Praat軟件中顯示非印歐語系的字元,但作者博爾斯馬表示[失效連結],目前尚無此功能,除非他將整個軟件轉換成Unicode版本。作者承諾[失效連結]將在4.7版中提供更多對Unicode的支持,並已從4.6.07版開始逐步提供相應的測試性實現。根據官方公布的消息頁面存檔備份,存於網際網路檔案館),自5.0.21版起,Praat支持在標註功能中使用漢字、韓文阿拉伯文基里爾字母等字符。
  10. ^ 聽覺語音學或心理語言學的實驗涉及對人腦功能的觀測,仍然需要特殊的儀器,而且價格十分昂貴。
  11. ^ 其中一部分也見於Praat軟件所附手冊文檔。
  12. ^ www.praat.org只是一個自動轉向這裡的域名。