HomeProjects信息及通訊科技個人化的廣東話語音合成技術

個人化的廣東話語音合成技術

項目簡介

項目負責人

  • 李丹教授

    電子工程學系

  • 資助機構

    創新科技署

    社會創新及創業發展基金

  • 合作夥伴

    創意讀書會

研究團隊利用人工智能技術開發個人化的廣東話語音合成技術,為使用者「複製」其聲線及說話方式。團隊先收集數據,與使用者進行錄音,內容涵蓋不同的廣東話詞彙。人工智能技術學習這套載有使用者常用語言搭配、語音特徵和措辭的訓練數據,以建構語音合成模型。這項技術可讓喪失說話的病人受惠。使用者只要輸入文字,便能以自己的聲音播出想說的話。

透過錄音收集病人的語音,建立數據庫

特點及優勢:

• 技術能完整地保留使用者最原始的聲線特徵。

• 合成聲音載於手機應用程式內,便於日常使用。

• 可讓喪失說話能力的病人受惠。

只要輸入文字,語音合成手機應用程式便能以用家的原聲播出想說的話

Do you like our project?

MORE TO EXPLORE