智能語音芯片十年“平民化”之路:啟英泰倫的“聲”意經(jīng)丨AI成都
“智能家電”能聽懂語音指令,背后是人工智能充當(dāng)“傳令官”。實(shí)現(xiàn)語音交互主要有云端處理與端側(cè)處理兩種路徑。
云端方案需依賴網(wǎng)絡(luò)將語音數(shù)據(jù)上傳到遠(yuǎn)程服務(wù)器解析,雖然算力強(qiáng)大,但存在響應(yīng)延遲、依賴網(wǎng)絡(luò)、隱私顧慮等問題。而端側(cè)AI將關(guān)鍵處理能力“內(nèi)置”于設(shè)備芯片中,就像給設(shè)備裝了即時(shí)響應(yīng)的“大腦”。它能在本地毫秒級完成語音識別與指令理解,無需聯(lián)網(wǎng),響應(yīng)更快,隱私更安全,為智能家電提供更可靠、自主的“耳朵”和“嘴巴”。
成都啟英泰倫科技有限公司早早專注于端側(cè)AI語音芯片產(chǎn)品,進(jìn)入家居家電領(lǐng)域。創(chuàng)業(yè)十年,歷經(jīng)3次大迭代、5次小迭代,共推出20多款型號的智能語音芯片,將端側(cè)AI語音芯片價(jià)格從40元降至4元,且集成度更高,體積大幅縮小。其推出的芯片和算法一體化設(shè)計(jì),為客戶縮短了產(chǎn)品開發(fā)周期,形成了核心競爭力。「啟英泰倫」創(chuàng)始人、董事長何云鵬告訴36氪四川,目前公司已發(fā)布具身智能新戰(zhàn)略,應(yīng)對萬億級智能物聯(lián)市場的新挑戰(zhàn)。
「啟英泰倫」AI語音芯片
多輪迭代:語音功能成家電標(biāo)配
「啟英泰倫」的展廳里有數(shù)十款各類帶智能語音功能的大小家電,如空調(diào)、油煙機(jī)等。何云鵬表示這只是一部分,若擺出所有搭載其AI語音芯片的產(chǎn)品,整層樓都得變成展廳。
「啟英泰倫」展廳(部分)
2015、2016年,語音識別通用方式是云端處理。創(chuàng)業(yè)初期的「啟英泰倫」團(tuán)隊(duì)提出把語音識別放在芯片端實(shí)現(xiàn),并在業(yè)界首度提出支持AI模型的腦神經(jīng)網(wǎng)絡(luò)處理器(BNPU)。
從技術(shù)上看,語音識別不分賽道領(lǐng)域。作為創(chuàng)業(yè)公司,「啟英泰倫」選擇智能家居家電領(lǐng)域,這里品類豐富,市場銷量大,與大眾生活緊密相關(guān),改善空間廣闊。
智能家居家電場景示例
每批家電生產(chǎn)規(guī)模以萬為單位,每臺家電都需要一顆AI語音芯片,它如同“聽覺中樞”,接收語音指令并驅(qū)動設(shè)備操作。
當(dāng)時(shí)語音識別還是新鮮的黑科技,是否是剛需有待考量。「啟英泰倫」第一代芯片產(chǎn)品應(yīng)用方案,芯片本體加外圍器件單價(jià)超40元。
何云鵬回憶,美的一款微波爐因面板空間小,功能增加受限,語音識別能解決這一痛點(diǎn)。2017年,成立不到三年的啟英泰倫憑借卓越的AI語音芯片拿下美的訂單。美的微波爐憑借語音交互成為高端產(chǎn)品,上市售價(jià)突破2000元。
獲得知名廠商訂單后,團(tuán)隊(duì)目標(biāo)是在保持技術(shù)優(yōu)勢的同時(shí),實(shí)現(xiàn)成本優(yōu)化與單價(jià)下調(diào)?!竼⒂⑻﹤悺沟诙酒=M單價(jià)控制在15元以內(nèi),讓更多對價(jià)格敏感的家電能搭載語音識別功能。隨著芯片價(jià)格降至個(gè)位數(shù),性能持續(xù)升級,識別準(zhǔn)確率提高,誤喚醒率降低,降噪能力增強(qiáng)。技術(shù)與成本的雙重優(yōu)化,推動搭載其AI語音芯片的家電產(chǎn)品快速普及。
目前,「啟英泰倫」的端側(cè)AI語音芯片實(shí)現(xiàn)了命令詞自學(xué)習(xí)、解決方言問題;支持遠(yuǎn)場降噪、人聲分離、定向噪聲抑制;首推端側(cè)NLP技術(shù),突破傳統(tǒng)語音芯片詞條限制,實(shí)現(xiàn)端側(cè)十萬數(shù)量級自由說法,推動端側(cè)語音交互向自然化升級;首推端側(cè)多意圖技術(shù),實(shí)現(xiàn)在端側(cè)一句話識別多個(gè)指令。
全棧式服務(wù):便捷實(shí)現(xiàn)設(shè)想,激發(fā)無限創(chuàng)新可能
何云鵬向36氪四川展示了展廳內(nèi)的得力智能交互地球儀,小朋友對著它提問,地球儀會亮起燈光,指引找到目標(biāo)地理位置并播報(bào)相關(guān)知識,能讓小朋友輕松掌握地理知識。
他還拿起肩頸按摩儀舉例,用戶按摩時(shí)操作不便,搭載語音操控功能后,無需睜眼就能操作。
何云鵬表示,很多場景都需要智能語音識別。2018年團(tuán)隊(duì)考慮到客戶大多不熟悉AI語音芯片技術(shù),一對一現(xiàn)場支持效率低。
與其他企業(yè)不同,「啟英泰倫」擁有語音芯片設(shè)計(jì)核心技術(shù),自研AI算法模型,堅(jiān)持芯片和AI模型一體化開發(fā)。這為其Turnkey全棧式服務(wù)提供基礎(chǔ),語音芯片、語音算法、應(yīng)用方案、開發(fā)平臺構(gòu)建完整閉環(huán),大大縮短了客戶產(chǎn)品的開發(fā)周期。
「啟英泰倫」全棧技術(shù)服務(wù)
在「啟英泰倫」的零代碼開發(fā)平臺上,客戶能在線開發(fā)固件、生成語言模型并優(yōu)化、進(jìn)行播報(bào)音合成等,快速實(shí)現(xiàn)設(shè)想。很多創(chuàng)意設(shè)計(jì)通過該技術(shù)路徑得以實(shí)現(xiàn)。
目前「啟英泰倫」芯片已匹配1萬款以上產(chǎn)品、300多個(gè)領(lǐng)域方案,離線語音家電市場覆蓋率達(dá)80%,客戶包括美的、海爾等千余家。此外,還合作了300多家方案商,拓展端側(cè)智能語音業(yè)務(wù),培育客群生態(tài)。
何云鵬透露,公司已著手規(guī)劃海外訂單拓展。中國端側(cè)AI語音技術(shù)全球領(lǐng)先,海外市場空間廣闊,團(tuán)隊(duì)期待帶著技術(shù)優(yōu)勢走向世界。
迎接新挑戰(zhàn):大模型+具身智能
今年3月,「啟英泰倫」聯(lián)合合作伙伴推出高性能離在線語音對話大模型方案。通過端 - 云協(xié)同設(shè)計(jì),本地完成喚醒、深度降噪、語音壓縮等任務(wù),復(fù)雜任務(wù)交由云端處理,實(shí)現(xiàn)低延遲、高準(zhǔn)確率的交互體驗(yàn)。
該方案兼容豆包、DeepSeek、通義千問、文心一言、ChatGPT等國內(nèi)外主流大模型平臺,能為企業(yè)及開發(fā)者提供大模型選型服務(wù)。適用場景廣泛,覆蓋家電、文創(chuàng)、玩具、機(jī)器人等領(lǐng)域。
離在線語音大模型方案應(yīng)用架構(gòu)
何云鵬2015年創(chuàng)業(yè)時(shí)就夢想讓陪伴機(jī)器人成為現(xiàn)實(shí),現(xiàn)在迎來契機(jī)。
「啟英泰倫」具身智能新戰(zhàn)略
「啟英泰倫」通過解決語音交互入口、更廣入口、機(jī)器人大腦“三個(gè)解決”,完成端側(cè)AI芯片的三步躍遷。今年6月路演活動中發(fā)布具身智能新戰(zhàn)略,其中“更廣入口”的端側(cè)超低功耗AI芯片獲四川省科技廳立項(xiàng)。該芯片在語音識別典型場景下運(yùn)行功耗小于10mW,安靜時(shí)待機(jī)功耗小于0.5mW,未來可應(yīng)用于具身智能機(jī)器人領(lǐng)域,也能為個(gè)人消費(fèi)電子設(shè)備提供高性能、超低功耗的語音入口。
「啟英泰倫」榮譽(yù)墻
2025年,「啟英泰倫」從智能家居拓展至大模型、具身智能機(jī)器人,從單模態(tài)語音發(fā)展到多模態(tài)交互。今年將完成流片的端側(cè)超低功耗AI芯片值得期待,公司正啟動新一輪融資。何云鵬表示:“期待與更多伙伴攜手,以端側(cè)AI芯片為支點(diǎn),撬動萬億級智能物聯(lián)市場。”
本文來自微信公眾號“36氪四川”,作者:36氪四川,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com