當前位置: 首頁 » 行業資訊 » 機器人»為了合成讓人類聽懂的語音，機器做了哪些“深度學習”？

為了合成讓人類聽懂的語音，機器做了哪些“深度學習”？

[點擊復制]

發布日期：2017-09-06 瀏覽次數：515

核心提示：　　深度進修在2006年開端嶄露頭腳后，近幾年獲得了飛速的成長，不管是學術研討照樣企業運用均出現出指數級增加的趨向；隨同著這項技巧的賡續成熟，深度進修在智能語音范疇率先發力，獲得一系列勝利的運用。　　例如

　　深度進修在2006年開端嶄露頭腳后，近幾年獲得了飛速的成長，不管是學術研討照樣企業運用均出現出指數級增加的趨向；隨同著這項技巧的賡續成熟，深度進修在智能語音范疇率先發力，獲得一系列勝利的運用。

　　例如，一。音色的定制化，須要跟蹤錄年夜量的音庫，從新練習一個模子；二。特性化表現辦法的定制化，可以錄一些數據，經由過程深度進修練習模子，自順應的辦法來完成。

　　深度進修在統計參數語音分解中的運用

　　語音分解重要采取波形拼接分解和統計參數分解兩種方法。波形拼接語音分解須要有足夠的高質量發音人灌音能力夠分解高質量的語音，它是貿易產物中最經常使用的語音分解技巧。統計參數語音分解固然全體分解質量略低，然則在小范圍語料、低占用資本的情形下，優勢更加顯著。另外，混雜語音分解結合了波形拼接分解和統計參數分解的優勢，選音辦法相似于傳統的波形拼接辦法，它應用參數分解辦法來指點選音；接上去重點引見今朝普遍應用的語音分解辦法：

　　（1）傳統的基于DNN/LSTM的分解

　　傳統的基于HMM統計參數的語音分解是在練習進程中樹立文本參數與聲學參數之間的映照模子，經由過程高斯混雜模子描寫每一個建模單位。在建模進程中有三個環節會招致語音音質降低，第一是決議計劃樹的聚類，第二是聲碼器，第三是參數生成算法。針對決議計劃樹聚類成績，可以經由過程深層神經收集樹立文本特點和聲學特點之間的映照關系，替換傳統的淺層模子，進步模子精度；比擬典范的深層神經收集模子構造包含深層相信神經收集和長短時記憶遞歸神經收集；后者具有更強的序列進修才能，采取BLSTM-RNN建模時，還可以跳過參數生成算法直接猜測語音參數，最初經由過程聲碼器便可以分解語音；總的來講，應用深層神經收集壯大的非線性建模才能，在必定水平上晉升了語音分解體系的機能，然則并沒有跳出原本的語音分解體系框架。

　　（2）基于WaveNet的分解

　　在已有的研討中，很少有人會直接在時域上對已有音頻建模。從直覺上剖析，構建一個自回歸模子，可以或許猜測每個samples是若何被后面一切的samples所影響的，是一個相當艱難的義務。谷歌提出的基于WaveNets的語音分解辦法，跳出了傳統語音分解框架，繞開聲碼器模塊，直接對采樣點停止猜測，面臨這個充斥挑釁的成績，獲得了沖破。

　　WaveNet語音分解體系的輸出包含文本特點和先前時段的音頻采樣點。個中文本特點的有用表述起到異常主要的感化。假如在沒有文本序列的情形上去練習收集，依然可以生成語音，然則沒法聽懂輸入音頻的內容。WaveNet語音分解體系存在的成績是模子每次輸入單個采樣點，盤算效力難以知足適用請求。可以引入一些自順應的辦法對已有模子停止優化，使其可以或許實用于分歧發音人。也能夠在模子的輸出端供給更多的信息，例如情緒或口音，如許使得生成的語音可以更多樣化，更具表示力。

　　（3）基于DeepVoice的分解

　　百度提出了Deep Voice語音分解體系，它將外面的許多模塊用深度神經收集去完成，經由過程相似于WaveNet的分解器來分解，后果也是比擬幻想的。已有的語音分解體系會在某些環節上采取深度進修，但在Deep Voice之前，沒有團隊采取全深度進修的框架。傳統語音分解須要停止年夜量的特點處置和特點構建，但百度經由過程應用深度進修防止了這些成績。這使得 Deep Voice 的運用規模加倍普遍，應用起來也加倍便利。假如須要運用于新的數據集，傳統的語音分解體系完成從新練習需數天到數周的時光停止調理，而對Deep Voice停止手動操作和練習模子所需的時光只需幾個小時就足夠。比擬于WaveNet語音分解體系，如今這個體系的有用速度晉升了400倍。

　　（4）兩個端對真個語音分解

　　第一個是Char2Wav，這個模子是直接對輸出的文本停止編碼，采取encoder-decoder模子。對輸出特點停止編碼，然后生成的中央編碼信息放到解碼器里停止最初的分解，分解采取SimpleRNN的分解器來分解語音，后果也是比擬幻想的，并且是典范的End-To-End的語音分解模子。

　　再一個是谷歌提出的端對真個語音分解體系，它跟Char2Wav比擬相似，輸出的也是Embeddings，分解的后果也比擬感性。

下一篇：水的污染問題要在岸上找“病因” 機器人為地下管網“診病”

上一篇：臨平新城將打造一座產業互聯網小鎮

[ 行業資訊搜索 ] [ 加入收藏 ] [ 告訴好友 ] [ 打印本文 ] [ 關閉窗口 ]

同類行業資訊

• 全市首個人形機器人數據訓練中心落地首鋼園民 • 1-2月江蘇出口工業機器人2億元同比增長118%
• 攻關機器人“大小腦”等關鍵技術，均勝電子與智 • “福州造”智能機器人熱銷
• 打造人形機器人產業競爭新優勢 • 中國成全球機器人最大“練兵場” 深圳劍指“第
• 7年投資44.2億元！廣東持續推進AI與機器人關鍵 • 人形機器人商業化落地可期
• 在成都，機器人批量造機器人 • 持續構建創新生態，浦東加速人形機器人多元場景

共0條 [查看全部] 相關評論

展會更多+

第26屆上海國際清

2025數控機床與金

2025中國(上海)機

2025武漢國際工業

04-032025中國(東莞)切削工業裝備博覽會

01-13第26屆上海國際清潔技術與設備博覽會

12-112025數控機床與金屬加工展暨第25屆中國國際工業博覽會

12-092025中國(上海)機器視覺展

12-042025第七屆亞洲消費電子技術展

視頻更多+

中舟智能固守科技

玉灃科技：精研滑

新松機器人自動化

羅克韋爾自動化（

10-11中舟智能固守科技創新新品首發添彩中國夢

10-11玉灃科技：精研滑臺十二載遙遙領先的模組

08-05新松機器人自動化股份有限公司

07-18羅克韋爾自動化（中國）企業宣傳片

07-18凌華科技機器手臂視覺導引解決方案

點擊排行

廣東推出12項硬核舉措力促AI與

“人機協同”要發揮各自“比較優

人形機器人生產節奏漸趨明確多

機器人產業前景廣闊汽車零部件

從實驗室到賽場我國人形機器人

馬斯克：今年目標生產5000臺人形

外媒：人形機器人首次在中國汽車

在成都，機器人批量造機器人

人形機器人商業化落地可期

7年投資44.2億元！廣東持續推進A

天堂色网-天堂色综合-天堂社区在线观看-天堂社区在线视频-天天操网-天天操网站

我的供應

我的求購

商鋪管理

工業機器人及行業應用

智能機器人

工業自動化

智能裝備

為了合成讓人類聽懂的語音，機器做了哪些“深度學習”？

• 全市首個人形機器人數據訓練中心落地首鋼園民	• 1-2月江蘇出口工業機器人2億元同比增長118%
• 攻關機器人“大小腦”等關鍵技術，均勝電子與智	• “福州造”智能機器人熱銷
• 打造人形機器人產業競爭新優勢	• 中國成全球機器人最大“練兵場” 深圳劍指“第
• 7年投資44.2億元！廣東持續推進AI與機器人關鍵	• 人形機器人商業化落地可期
• 在成都，機器人批量造機器人	• 持續構建創新生態，浦東加速人形機器人多元場景

第26屆上海國際清	2025數控機床與金
2025中國(上海)機	2025武漢國際工業

中舟智能固守科技	玉灃科技：精研滑
新松機器人自動化	羅克韋爾自動化（