NVIDIA 研究 AI 語音模仿真實人聲 助語言障礙者日常生活

| 徐慧兒 | 02-09-2021 16:13 | |
NVIDIA 研究 AI 語音模仿真實人聲  助語言障礙者日常生活

NVIDIA 研究將 AI 人工智能合成的聲音與真實人聲作整合,並於 INTERSPEECH 2021 大會上展示現時研製出的 AI 語音對話模型,打破人類說話時不同的語調、節奏和音色,使全新的 AI 語音系統可用於線上客服、遊戲,甚或是讓語言障礙患者在日常生活中應用。

  • NVIDIA 研究整合 AI 合成聲音和真實人聲的差異
  • 打破人類說話時不同的語調、節奏和音色
  • 是次研發的 AI 語音模型,可捕捉及模仿人類說話聲音的細節

NVIDIA 是次研發出的 AI 語音模型,可以捕捉和模仿人類說話時聲音的細節,使 AI 合成出來的聲音與真實的人聲更加相似。AI 語音模型可應用於配音、文字轉語音、遊戲上,甚至可以幫助語言障礙患者用自己的聲音翻譯成不同的語言。另外,還可配合歌曲旋律,模擬歌手唱歌時,還可模仿出歌手唱歌時的感情。

此研究的部分成果已在 NVIDIA NeMo 工具套件中成為開放式原始碼,有興趣的用家可在 NVIDIA GPU Cloud(NGC)或其他軟件中心取得,經最佳化調整後,可配合 NVIDIA 的高效能 GPU 執行。

與此同時,研究團隊仍持續研究 AI 對話功能,包括自然語言處理、自動語音識別、關鍵字偵測、音訊增強等。

【相關報道】網民以 AI 將動漫遊戲角色換成真人!Thanos 竟變鬍子老伯?【下一頁

【相關報道】【AI炒魷】人工智能判定員工不敬業! 俄羅斯遊戲公司因而裁掉近 150 名員工【下一頁

即刻【按此】,用 App 睇更多產品開箱科技影片

Source:Digital Trends

Page 1 of 12