中央研究院口語韻律語料庫暨工具平台 | 非營利組織網
![中央研究院口語韻律語料庫暨工具平台](https://i.imgur.com/9pCpbOd.jpg)
COSPRO&Toolkit係中研院語言所特聘研究員鄭秋豫從事語流韻律研究,...及依研究需要所發展的工具平台,可供語音研究、語音合成與語者辨識等多方面應用。
![中央研究院口語韻律語料庫暨工具平台](https://i.imgur.com/9pCpbOd.jpg)
摘要
COSPRO & Toolkit係中研院語言所特聘研究員鄭秋豫從事語流韻律研究,於1994至2005年收集之國語連續語流語料,及依研究需要所發展的工具平台,可供語音研究、語音合成與語者辨識等多方面應用。
COSPRO包含9個子語料庫,每個子語料庫針對不同的語流韻律現象設計而成:COSPRO 01-08為麥克風朗讀語音,COSPRO 09則為麥克風自發性語音。內容包括不同長度的語料:孤立詞組(1至4字詞)、孤立句(含直述、驚嘆、疑問句)、無意義字串隨機排列句(“Word Salad”),及段落語篇(85至996音節)。
本資料庫共10.5GB,約132小時,共有114人次口語資料(53男61女)。其中7.7 GB的語料已經過處理,並附說明,釋出wav檔案、每位語者的朗讀(轉寫)文本(*.txt)、人工調整音標檔(*.adjusted / *.syl),以及停延韻律標記檔(*.break);其餘未經處理之原始語料,則釋出wav檔案、語者的朗讀(轉寫)文本(*.txt),以及程式處理過後的音標檔(*.phn)。
COSPRO與其他語料庫最大的差異在於:包含 (1)人工調整音標檔(*.adjusted / *.syl):不只是HTK處理過的音段標註檔案(*.phn)。處理完成之語料均以人工方式對齊語音音段邊界,標註子音與母音的時間碼。(2)停延韻律標記檔(*.break):經過訓練之標音員以聽感為基礎標註韻律,並通過標註一致性檢驗。人工感知韻律標註的主要意義在於:以本語料庫所提供的韻律標記做為語音信號分析的標準答案,而非得自文本分析結果,是符合語音事實的韻律單位,目的是突顯語音與文本不完全匹配的事實。
COSPRO Toolkit則為一視窗介面,易操作的語音分析暨合成之工具平台,集合了Adobe Audition、Praat及Speech Viewer等常見語音分析(合成)軟體之特點,其主要功能包括:聲學訊號分析功能、標記口語語流功能以及重新合成語音訊號功能,特別適合作為教學工具。
...【尋找在地AI技術力】臺灣的中文語音引擎在哪裡?(下 ... | 非營利組織網
中央研究院口語韻律語料庫暨工具平台 | 非營利組織網
中文語音辨識難度高中研院研發「廣義知網」助判讀 | 非營利組織網
中研院具音段標記之中文對話語音資料庫 | 非營利組織網
中研院漢語對話語音語料庫 | 非營利組織網
中研院資訊所王新民研究員 | 非營利組織網
基於小波轉換之語音特徵壓縮技術應用於分散式 ... | 非營利組織網
研究主題清單(Research List) | 非營利組織網
科學再發現–中文語音辨識難度高中研院「廣義知網」助判讀 ... | 非營利組織網
聲音內容的科技跨界:中研院研究員王新民談自然語音與其他AI ... | 非營利組織網
![](https://i.imgur.com/9pCpbOd.jpg)
中華民國國際語言學會統編是多少?統一編號:18480207
組織名稱:中華民國國際語言學會統一編號:18480207所在縣市:臺北市異動日期:891213異動原因:申請設立登記
![](https://i.imgur.com/9pCpbOd.jpg)
中華民國國際語言學會統編是多少?統一編號:18480207
組織名稱:中華民國國際語言學會統一編號:18480207所在縣市:臺北市異動日期:891213異動原因:申請設立登記