亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

揭開(kāi)AI玩具“聽(tīng)清語(yǔ)音”的奧秘!這幾款語(yǔ)音前端芯片打造頂級(jí)交互體驗(yàn)

3分鐘前

電子發(fā)燒友網(wǎng)報(bào)道(文 / 黃山明)在AI大模型的助力下,AI玩具最重要的功能當(dāng)屬語(yǔ)音交互。而要實(shí)現(xiàn)良好的語(yǔ)音交互,離不開(kāi)語(yǔ)音前端處理芯片的支持。


由于玩具麥克風(fēng)拾取的聲音中混雜著喇叭回聲、環(huán)境噪聲和混響,而主控SoC的算力、功耗和實(shí)時(shí)性難以承受7×24小時(shí)的AEC+NR+Beamforming+喚醒運(yùn)算。因此,前端芯片需要先截取出“干凈的人聲”,再將其傳送給主控或云端,這樣才能同時(shí)保證打斷喚醒、低誤觸發(fā)和低功耗。


所以,在目前的AI玩具中,一款優(yōu)秀的語(yǔ)音前端處理芯片能顯著提升用戶的使用體驗(yàn)。


以今年市場(chǎng)上已量產(chǎn)的AI玩具為例,像Haivivi BubblePal、字節(jié)“顯眼包”掛件,采用的是啟英泰倫CI1302/1303。這兩款芯片是專為智能語(yǔ)音交互場(chǎng)景設(shè)計(jì)的專用芯片,特別適合AI玩具、智能家電等輕量化語(yǔ)音交互設(shè)備。


這兩款新品均采用220 MHz 32 - bit CPU以及第三代BNPU(腦神經(jīng)網(wǎng)絡(luò)處理器)。在語(yǔ)音交互方面,內(nèi)置128ms頻域回聲消除,喇叭→MIC回采衰減≥45dB。與BNPU聯(lián)合進(jìn)行“DNN殘差降噪”,在70dB環(huán)境噪聲下,實(shí)測(cè)識(shí)別率仍≥85%,喚醒率≥90%。


啟英泰倫的CI1306芯片應(yīng)用于兒童陪護(hù)機(jī)器人,它是第三代高性能神經(jīng)網(wǎng)絡(luò)智能語(yǔ)音芯片的旗艦型號(hào),專為高復(fù)雜度離線語(yǔ)音交互場(chǎng)景設(shè)計(jì),尤其適合對(duì)語(yǔ)音識(shí)別精度、抗噪能力和自然對(duì)話能力要求較高的產(chǎn)品。


與CI1302/1303的單麥方案不同,CI1306采用雙麥克風(fēng)深度語(yǔ)音增強(qiáng),也是CI130X系列中唯一明確支持完整雙麥算法棧的型號(hào),具備波束成形、聲源定位、深度人聲分離、AEC、混響抑制等功能。


湯姆貓AI童伴機(jī)器人采用的是全志R128 - S3,采用RISC - V XuanTie C906與Arm M33 Star MCU雙核異構(gòu)架構(gòu),搭配HiFi5 DSP。集成1個(gè)24位音頻編解碼器DAC通道,3個(gè)ADC通道,DAC播放路徑中的信噪比高達(dá)119dB,ADC記錄路徑期間的信噪比高達(dá)98dB,可提供高質(zhì)量的語(yǔ)音輸入輸出處理,確保語(yǔ)音信號(hào)的清晰和準(zhǔn)確。


簡(jiǎn)單來(lái)講,全志的這款R128 - S3,單芯片就能讓200元以內(nèi)的AI玩具實(shí)現(xiàn)5米遠(yuǎn)場(chǎng)打斷喚醒、本地500命令詞、云端大模型連續(xù)對(duì)話,是目前市場(chǎng)上在性能、功耗和BOM方面平衡得極為出色的中端陪護(hù)機(jī)器人的語(yǔ)音SoC方案。


還有應(yīng)用在一些繪本機(jī)器人上的炬芯ATS3703,這是一顆定位中端AI玩具+早教機(jī)器人的多媒體SoC,官方將語(yǔ)音交互做成硬加速模塊,而非外掛DSP。參數(shù)上擁有雙路24 - bit ADC,SNR 98 dB,可直接接2×差分模擬MIC或4×PDM數(shù)字麥,內(nèi)置128 ms硬件頻域AEC,回聲消除深度≥45 dB,芯片級(jí)DNN降噪加速單元(10 GOPS INT8),在60 dB環(huán)境噪聲下喚醒率保持≥90%。


炬芯ATS3703單芯片可讓200 - 400元的早教機(jī)器人實(shí)現(xiàn)3 - 5米遠(yuǎn)場(chǎng)打斷喚醒、本地自然說(shuō)、視頻聊天、人臉識(shí)別,是目前中端陪護(hù)類AI玩具出貨量靠前的多媒體語(yǔ)音方案。


一些能夠看向人再進(jìn)行交互的AI玩具采用了泰芯TXW81x,這是一枚Wi - Fi+藍(lán)牙雙模、音視頻All - in - One的2.4 GHz SoC,官方將語(yǔ)音前端和聲學(xué)前處理做成硬加速IP,主打50 – 300元價(jià)位帶屏AI玩具。


參數(shù)方面,Audio Codec采用雙路24 - bit ADC,SNR 98 dB;DAC SNR 95 dB,采樣率8 – 48 kHz可配。PDM接口上內(nèi)置4×PDM通道,可直接接4路數(shù)字MEMS麥。硬件AEC擁有128ms頻域回聲消除,回聲抑制≥45 dB,喇叭90dB播放時(shí)仍可打斷喚醒。還具有嘯叫抑制功能,片內(nèi)自適應(yīng)Howling - suppression,增益> 40 dB無(wú)自激,適合喇叭 - 麥克風(fēng)同腔玩具。


該芯片能讓帶屏AI玩具實(shí)現(xiàn)5米遠(yuǎn)場(chǎng)打斷、本地500命令詞、云端大模型連續(xù)對(duì)話、媽媽音色克隆,是目前中高端陪護(hù)類玩具出貨量增長(zhǎng)最快的音視頻無(wú)線SoC方案。


小結(jié)


AI玩具的對(duì)話體驗(yàn)并非僅由大模型決定;一顆成本占比可能極低的語(yǔ)音前端處理芯片先優(yōu)化聲學(xué)環(huán)境,后續(xù)的云端/端側(cè)大模型才能聽(tīng)得清、答得快、功耗低。


更多熱點(diǎn)文章閱讀


點(diǎn)擊關(guān)注 星標(biāo)我們


將我們?cè)O(shè)為星標(biāo),不錯(cuò)過(guò)每一次更新!


喜歡就獎(jiǎng)勵(lì)一個(gè)“在看”吧!


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com