一区二区三区无码视频免费福利,亚洲va中文字幕无码毛片同性,久久无码a∨一区二区

語音識別走到了哪一步

2018-05-16 17:03 中國智能化網(wǎng)

導(dǎo)讀：在人工智能快速發(fā)展的今天，語音識別開始成為很多設(shè)備的標(biāo)配，語音識別開始被越來越多的人關(guān)注，國外微軟、谷歌、Facebook，國內(nèi)的科大訊飛、思必馳等廠商都在研發(fā)語音識別新策略新算法，今天小編就將為你做語音識別技術(shù)的簡單介紹，并談?wù)勊陌l(fā)展歷程和未來可能的發(fā)展方向。

　　在人工智能快速發(fā)展的今天，語音識別開始成為很多設(shè)備的標(biāo)配，語音識別開始被越來越多的人關(guān)注，國外微軟、谷歌、Facebook，國內(nèi)的科大訊飛、思必馳等廠商都在研發(fā)語音識別新策略新算法，今天小編就將為你做語音識別技術(shù)的簡單介紹，并談?wù)勊陌l(fā)展歷程和未來可能的發(fā)展方向。

　　語音識別技術(shù)

　　在電影《鋼鐵俠》中，智能助理賈維斯的出色表現(xiàn)讓大家充滿了對智能語音助手的期待。語音識別技術(shù)就是為了讓機(jī)器人聽明白你在說什么，它就好比“機(jī)器的聽覺系統(tǒng)”，該技術(shù)讓機(jī)器通過識別和理解，把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令。

　　聽覺系統(tǒng)

　　語音識別系統(tǒng)本質(zhì)上是一種模式識別系統(tǒng)，包括特征提取、模式匹配、參考模式庫等三個(gè)基本單元，它的基本結(jié)構(gòu)如下圖所示：

　　模式識別系統(tǒng)

　　語音識別系統(tǒng)構(gòu)建過程整體上包括兩大部分：訓(xùn)練和識別。訓(xùn)練通常是離線完成的，海量未知語音經(jīng)過話筒變換成電信號后加在識別系統(tǒng)的輸入端，首先經(jīng)過預(yù)處理，再根據(jù)人的語音特點(diǎn)建立語音模型，對輸入的語音信號進(jìn)行分析，并抽取所需的特征，在此基礎(chǔ)上建立語音識別所需的模板;而識別過程通常是在線完成的，對用戶實(shí)時(shí)的語音進(jìn)行自動(dòng)識別。識別過程通常又可以分為“前端”和“后端”兩大模塊：“前端”模塊主要的作用是進(jìn)行端點(diǎn)檢測(去除多余的靜音和非說話聲)、降噪、特征提取等;“后端”模塊的作用是利用訓(xùn)練好的“聲學(xué)模型”和“語言模型”對用戶說話的特征向量進(jìn)行統(tǒng)計(jì)模式識別(又稱“解碼”)，得到其包含的文字信息。

　　事實(shí)上，語音識別60多年的發(fā)展過程可以分成多個(gè)階段。早期的20多年，即從20世紀(jì)50年代到70年代，是科學(xué)家們走彎路的階段，全世界的科學(xué)家認(rèn)為必須先讓計(jì)算機(jī)理解自然語言，也就是用電腦模擬人腦，這20多年的研究成果近乎為零。

　　直到1970年后，統(tǒng)計(jì)語言學(xué)的出現(xiàn)才使語音識別重獲新生，并取得了今天的非凡成就。推動(dòng)這個(gè)技術(shù)路線轉(zhuǎn)變的關(guān)鍵人物是德里克?賈里尼克。采用統(tǒng)計(jì)的方法，IBM將當(dāng)時(shí)的語音識別率提升到了90%，同時(shí)語音識別的規(guī)模從幾百單詞上升到幾萬單詞，這樣語音識別就有了從實(shí)驗(yàn)室走向?qū)嶋H應(yīng)用的可能。

語音識別走到了哪一步

相關(guān)閱讀