聲音識別又稱聲紋識別,是生物識別技術(shù)的一種,也稱為說話人識別,有兩類,即說話人辨認和說話人確認。不同的任務(wù)和應(yīng)用會使用不同的聲紋識別技術(shù),如縮小刑偵范圍時可能需要辨認技術(shù),而銀行交易時則需要確認技術(shù)。聲紋識別就是把聲信號轉(zhuǎn)換成電信號,再用計算機進行識別。
一、聲音識別技術(shù)的原理
所謂聲紋(Voiceprint),是用電聲學(xué)儀器顯示的攜帶言語信息的聲波頻譜。人類語言的產(chǎn)生是人體語言中樞與發(fā)音器官之間一個復(fù)雜的生理物理過程,人在講話時使用的發(fā)聲器官--舌、牙齒、喉頭、肺、鼻腔在尺寸和形態(tài)方面每個人的差異很大,所以任何兩個人的聲紋圖譜都有差異。每個人的語音聲學(xué)特征既有相對穩(wěn)定性,又有變異性,不是絕對的、一成不變的。
這種變異可來自生理、病理、心理、模擬、偽裝,也與環(huán)境干擾有關(guān)。盡管如此,由于每個人的發(fā)音器官都不盡相同,因此在一般情況下,人們?nèi)阅軈^(qū)別不同的人的聲音或判斷是否是同一人的聲音。
二、聲音識別技術(shù)的優(yōu)缺點
聲紋識別的應(yīng)用有一些缺點,比如同一個人的聲音具有易變性,易受身體狀況、年齡、情緒等的影響;比如不同的麥克風(fēng)和信道對識別性能有影響;比如環(huán)境噪音對識別有干擾;又比如混合說話人的情形下人的聲紋特征不易提?。煌瑫r當(dāng)人感冒,咽喉發(fā)炎等情況聲帶特性會發(fā)生變化而導(dǎo)致識別障礙……等等。盡管如此,與其他生物特征相比,聲紋識別的應(yīng)用有一些特殊的優(yōu)勢:
1)蘊含聲紋特征的語音獲取方便、自然,聲紋提取可在不知不覺中完成,因此使用者的接受程度也高;
2)獲取語音的識別成本低廉,使用簡單,一個麥克風(fēng)即可,在使用通訊設(shè)備時更無需額外的錄音設(shè)備;
3)適合遠程身份確認,只需要一個麥克風(fēng)或電話、手機就可以通過網(wǎng)路(通訊網(wǎng)絡(luò)或互聯(lián)網(wǎng)絡(luò))實現(xiàn)遠程登錄;
4)聲紋辨認和確認的算法復(fù)雜度低;
5)配合一些其他措施,如通過語音識別進行內(nèi)容鑒別等,可以提高準(zhǔn)確率;……等等。這些優(yōu)勢使得聲紋識別的應(yīng)用越來越收到系統(tǒng)開發(fā)者和用戶青睞,聲紋識別的世界市場占有率15.8%,僅次于指紋和掌紋的生物特征識別,并有不斷上升的趨勢。