聲音內容的科技跨界:中研院研究員王新民談自然語音與其他AI ... | 非營利組織網
![聲音內容的科技跨界:中研院研究員王新民談自然語音與其他AI ...](https://i.imgur.com/9pCpbOd.jpg)
2021年3月22日—語音合成(TextToSpeech,TTS,文字轉語音)是老技術了,因為人工錄製的成本高,很早以前的盲人有聲書就有利用語音合成來錄製的案例。早期TTS的技術 ...
![聲音內容的科技跨界:中研院研究員王新民談自然語音與其他AI ...](https://i.imgur.com/9pCpbOd.jpg)
【本文由文化內容策進院 TAICCA X OPENBOOK 閱讀誌 共同合作企劃】
聲音經濟是時代趨勢,除了專業聲音演員錄製的有聲書,電腦科技也提供了快速簡便的文字轉聲音服務。如何克服電腦合成語音常出現的聲調機械平板問題?如何讓AI理解文字中的多重語意,展現其中的感情和情緒?本文專訪電腦語音專家:中研院資訊科學研究所研究員王新民,解析聲音科技的目前進展與未來應用。
提問:Openbook 閱讀誌/文字整理:周月英/攝影:小石
中研院研究員王新民。
訪談者簡介: 王新民 畢業於臺灣大學電機工程學系及電機工程學研究所博士班,他是中央研究院資訊科學研究所的研究員,也是成功大學資工系的合聘教授。他目前擔任中華民國計算語言學學會的監事,曾擔任該學會理事長。他的研究興趣包括語音處理、自然語言處理、多媒體資訊檢索及機器學習等。
語音合成 vs 人工錄製
問:近年來「聲音經濟」大熱,有聲書市場看俏,請談談與人工錄製的有聲內容相較,語音合成的優點和缺點為何?
王新民:大陸因為此波肺炎疫情關係,2020 年線上閱讀的流量爆增,也創造了驚人的有聲書市場。臺灣「聽書」的市場才剛要起步,如果我們對有聲書需求是以自然、中性、不帶情感的語音讀出文本內容,那麼現今的科技已經可以做得很好了。
語音合成(Text To Speech,TTS,文字轉語音)是老技術了,因為人工錄製的成本高,很早以前的盲人有聲書就有利用語音合成來錄製的案例。早期 TTS 的技術有限,語音合成的聲音比較機械式,有點像《星際大戰》裡機器人說話的聲音,是用訊號處理的方式模擬生成的,所以語調都是平的。
也有一種方式是事先錄製需要的音檔片段,再串接播放,例如大家熟悉的台...
语音合成 | 非營利組織網
聲音內容的科技跨界:中研院研究員王新民談自然語音與其他AI ... | 非營利組織網
中文文字轉語音技術-技術移轉 | 非營利組織網
網際智慧TTS文字轉語音 | 非營利組織網
雅婷文字轉語音 | 非營利組織網
TTS 文字轉語音技術協助網際智慧與您一起打造科技無障礙空間 ... | 非營利組織網
Google發表雲端文字轉語音服務,人聲發音更好、更自然 ... | 非營利組織網
Google 雲端機器學習推出最新「文字轉語音API」 ,還升級讓 ... | 非營利組織網
文字轉換語音 | 非營利組織網
![](https://i.imgur.com/9pCpbOd.jpg)
中華民國國際語言學會統編是多少?統一編號:18480207
組織名稱:中華民國國際語言學會統一編號:18480207所在縣市:臺北市異動日期:891213異動原因:申請設立登記
![](https://i.imgur.com/9pCpbOd.jpg)
中華民國國際語言學會統編是多少?統一編號:18480207
組織名稱:中華民國國際語言學會統一編號:18480207所在縣市:臺北市異動日期:891213異動原因:申請設立登記