亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

回聲消除技術(shù):為智能設(shè)備打造“降噪護(hù)盾”

07-30 06:57


視覺中國供圖


◎本報記者都芃


如今,用語音操控智能車機、一句話喚醒智能家電、手機智能助手隨叫隨到等場景屢見不鮮。憑借便捷、自然的體驗,語音交互正深刻改變著智能時代的生產(chǎn)生活方式。而回聲消除作為語音交互的核心技術(shù)之一,其技術(shù)水平直接影響著人們的語音交互體驗。


不久前,國家知識產(chǎn)權(quán)局公布了第二十五屆中國專利金獎項目名單,科大訊飛股份有限公司憑借“基于時延估計的回聲消除方法及裝置”專利成功入選。該專利技術(shù)顯著提升了語音系統(tǒng)中的回聲消除效果,極大改善了語音系統(tǒng)的實際應(yīng)用體驗。


抓住時延這個關(guān)鍵“鑰匙”


提到回聲,很多人會想到在山中對著山谷呼喊,隨后傳來陣陣回聲的場景。這是聲音傳播受阻反射形成的現(xiàn)象。但在語音系統(tǒng)里,回聲更多是由麥克風(fēng)和揚聲器耦合導(dǎo)致的。科大訊飛相關(guān)技術(shù)負(fù)責(zé)人張科舉例說:“比如進(jìn)行視頻會議時,揚聲器播放對方聲音,如果不進(jìn)行回聲消除,對方聲音會被我方麥克風(fēng)接收并傳回對方,使其聽到自己說話的回聲。”


要消除回聲,系統(tǒng)得先識別出回聲。張科表示,理想情況下可將揚聲器播放前的信號作為基礎(chǔ)來抵消回聲,但實際情況復(fù)雜得多,參考信號與麥克風(fēng)信號存在時延,所以準(zhǔn)確估計時延、矯正對齊信號很關(guān)鍵,這就是基于時延估計的回聲消除方法。


該方法的核心是,麥克風(fēng)收錄聲音時,系統(tǒng)先通過時延估計算法算出揚聲器聲音到麥克風(fēng)的傳輸時間差,再據(jù)此構(gòu)建動態(tài)濾波器,從混合信號中精準(zhǔn)剝離揚聲器回聲,最終留下純凈的用戶語音。


例如用語音控制智能機頂盒時,要避免電視聲音回傳導(dǎo)致誤操作。消除回聲時,可將機頂盒輸出給電視的音視頻源信號作為參考信號,計算其與麥克風(fēng)信號的時延,進(jìn)而消除回聲,得到純凈的語音控制聲音。


實現(xiàn)時延估計又快又準(zhǔn)


準(zhǔn)確計算時延參數(shù)并非易事。在真實語音交互環(huán)境中,基于時延估計進(jìn)行回聲消除面臨三大問題。一是設(shè)備振動使信號變形,加上交互時的目標(biāo)人聲,影響時延估計準(zhǔn)確率。二是揚聲器與麥克風(fēng)之間的時延受設(shè)備采樣率、音效變聲、網(wǎng)速變化等多種因素影響,動態(tài)估計時延是一大挑戰(zhàn)。此外,時延估計要及時準(zhǔn)確,否則會導(dǎo)致回聲消除不干凈,系統(tǒng)出現(xiàn)嘯叫、自說自話等現(xiàn)象。


針對這些挑戰(zhàn),科大訊飛研發(fā)團(tuán)隊在該專利研發(fā)中有三大創(chuàng)新。針對設(shè)備振動引起信號變形和目標(biāo)人聲疊加難題,團(tuán)隊首創(chuàng)基于相似度的異常頻點檢測技術(shù),能在聲音信號中準(zhǔn)確排除變形信號和說話人語音的異常時頻點,精準(zhǔn)過濾回聲。


由于時延會動態(tài)變化,團(tuán)隊首創(chuàng)統(tǒng)計與瞬時結(jié)合的動態(tài)時延估計技術(shù),引入瞬時信息決策,解決時延多變問題。應(yīng)用該技術(shù)后,時延估計準(zhǔn)確率從60%大幅提升至98%。


張科稱,用統(tǒng)計與瞬時結(jié)合的方法進(jìn)行時延估計仍有不準(zhǔn)確問題。團(tuán)隊分析發(fā)現(xiàn),要提升準(zhǔn)確率,需先篩選統(tǒng)計量,得到準(zhǔn)確的瞬時候選位置,再與統(tǒng)計量結(jié)合,難點是平衡速度和準(zhǔn)確性。“速度快了可能不準(zhǔn)確。”張科介紹,團(tuán)隊經(jīng)大量實驗改進(jìn)方法,靈活選更短窗長,復(fù)用歷史濾波器系數(shù),大幅提高濾波器更新及時性,使延遲確認(rèn)時間從40毫秒降至10毫秒。


廣泛應(yīng)用于多樣場景


該專利技術(shù)通用性良好,不僅用于回聲消除,還廣泛用于多類語音場景。比如可為手機、汽車、家電等多麥克風(fēng)智能硬件語音降噪;在工業(yè)生產(chǎn)、智能制造等噪聲多樣場景中,可快速追蹤與識別噪聲;還能用于醫(yī)療領(lǐng)域,幫助聽力輔助設(shè)備抑制嘯叫。


張科介紹,目前該技術(shù)已深度融入科大訊飛智能終端產(chǎn)品矩陣,在消費級產(chǎn)品中廣泛應(yīng)用。像訊飛翻譯機、訊飛錄音筆等都運用了相關(guān)技術(shù)。


下一步,團(tuán)隊打算將該技術(shù)與深度學(xué)習(xí)結(jié)合,開展基于數(shù)據(jù)驅(qū)動的模型訓(xùn)練,更快更準(zhǔn)確地估計時延,進(jìn)一步提升回聲消除效果和降噪能力,以適應(yīng)更多不同硬件及應(yīng)用場景。


本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com