文章摘要: 語言作為人類基本的交流方式,在幾千年的歷史中不斷地傳承下來。近年來,語音識別技術(shù)的不斷成熟,在我們的生活中得到了廣泛的應(yīng)用,成為人機(jī)通過自然語言進(jìn)行交互的重要方式之一。語音識別技術(shù)如何讓機(jī)器“理解”人類語言?隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,人們對機(jī)
語言作為人類基本的交流方式,在幾千年的歷史中不斷地傳承下來。近年來,語音識別技術(shù)的不斷成熟,在我們的生活中得到了廣泛的應(yīng)用,成為人機(jī)通過自然語言進(jìn)行交互的重要方式之一。語音識別技術(shù)如何讓機(jī)器“理解”人類語言?隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,人們對機(jī)器的依賴程度已經(jīng)達(dá)到了非常高的水平。語音識別技術(shù)使人與機(jī)器通過自然語言進(jìn)行交互成為可能。普遍的情況是通過語音識別控制房間照明、空調(diào)溫度和電視相關(guān)操作。
根據(jù)識別對象的不同,語音識別任務(wù)大概可以分為三類,即孤立詞識別、關(guān)鍵詞識別(或關(guān)鍵詞檢測)和連續(xù)語音識別。其中,孤立詞識別的任務(wù)是識別預(yù)先已知的孤立詞,如“開啟”、“關(guān)閉”等;連續(xù)語音識別的任務(wù)是識別任何連續(xù)的語音,例如句子或段落;連續(xù)語音流中的關(guān)鍵詞檢測是針對連續(xù)語音的,但它并不識別所有的文本,而只是檢測一些已知關(guān)鍵詞出現(xiàn)的位置。
根據(jù)目標(biāo)說話人,語音識別技術(shù)可分為特定人語音識別和非特定人語音識別。前者只能識別一個(gè)人或幾個(gè)人的聲音,而后者任何人都可以使用。顯然,獨(dú)立于人的語音識別系統(tǒng)更符合實(shí)際需求,但比識別特定的人要困難得多。
此外,根據(jù)語音設(shè)備和通道,可分為桌面(PC)語音識別、電話語音識別和嵌入式設(shè)備(手機(jī)、PDA等)語音識別。不同的采集通道會扭曲人類發(fā)音的聲學(xué)特征,因此需要構(gòu)建自己的識別系統(tǒng)。
語音識別的應(yīng)用領(lǐng)域非常廣泛。普遍的應(yīng)用系統(tǒng)有:語音輸入系統(tǒng),更符合人們的日常習(xí)慣,比鍵盤輸入更自然;語音控制系統(tǒng),即使用語音識別控制設(shè)備操作比手動控制更快捷方便,可應(yīng)用于工業(yè)控制、語音撥號系統(tǒng)、智能家電、聲控智能玩具等多個(gè)領(lǐng)域。
簡單了解一下語音識別
本文由入駐排行8資訊專欄的作者撰寫或者網(wǎng)上轉(zhuǎn)載,觀點(diǎn)僅代表作者本人,不代表排行8立場。不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請發(fā)送郵件至 paihang8kefu@163.com 舉報(bào),一經(jīng)查實(shí),本站將立刻刪除。
我國玉米收獲機(jī)需求格局
2025-10-05做產(chǎn)品質(zhì)量的領(lǐng)先者
2025-10-03我國拖拉機(jī)正在迎來國際市場新機(jī)遇
2025-10-01開展量化績效管理 激勵干部擔(dān)當(dāng)作為
2025-09-25