4 分鐘新聞聯(lián)播力挺,時(shí)空壺 AI 耳機(jī)爆紅并非沒(méi)有理由
很多做外貿(mào)的朋友經(jīng)常要和海外客戶溝通,翻譯耳機(jī)成了日常的“標(biāo)準(zhǔn)”。
但是傳統(tǒng)的同聲傳譯耳機(jī)往往是“一人一句”的翻譯,聽(tīng)起來(lái)很生硬,就像機(jī)械地說(shuō)話一樣,更不用說(shuō)兩個(gè)人同時(shí)說(shuō)話的時(shí)候,耳機(jī)經(jīng)?;煜曇簦粩嗍杪┓g,感覺(jué)真的很糟糕。
最近,狐妹發(fā)現(xiàn)時(shí)空壺這一品牌的同傳耳機(jī)越來(lái)越受歡迎,因?yàn)樗鉀Q了“多聲疊加”這一難題。
甚至前陣子,央視 30 《新聞聯(lián)播》還花了整整一分鐘。 4 專(zhuān)門(mén)報(bào)道他們幾分鐘,可見(jiàn)他們的實(shí)力。
這種“能打”的背后,是時(shí)空壺多年打磨的矢量降噪技術(shù),讓耳機(jī)在嘈雜的環(huán)境中準(zhǔn)確“聽(tīng)清楚”;加上 AI 大型模型支持翻譯邏輯,確保“準(zhǔn)確翻譯”。
聽(tīng)到準(zhǔn)確,翻得好,直接拉高了。 AI 技術(shù)門(mén)檻同傳。
無(wú)論是地鐵、機(jī)場(chǎng)還是國(guó)際展覽,在這些最考驗(yàn)設(shè)備的場(chǎng)景中,都能清晰地捕捉到聲音,快速翻譯導(dǎo)出,不卡殼,不偏離,真正做到“聽(tīng)得清楚,翻得順暢”。
“時(shí)空壺正在把” AI 同聲傳譯“這種聽(tīng)上去很高級(jí)的技術(shù),悄悄地進(jìn)入了日常生活。使每一個(gè)人,在交流中都能擁有自己的“賈維斯”。
AI 同聲傳譯最難的不是“翻譯”,而是“聽(tīng)不見(jiàn)”
談起 AI 翻譯,很多人的第一反應(yīng)可能是翻譯的準(zhǔn)確性。事實(shí)上,在工程和算法團(tuán)隊(duì)眼里,最難啃的骨頭是語(yǔ)音輸入端的噪聲干擾。
特別是在機(jī)場(chǎng)廣播不斷,地鐵嘈雜,展會(huì)人流密集的環(huán)境下,很多翻譯耳機(jī)要么“聽(tīng)不見(jiàn)”,要么將背景音混入翻譯中,將無(wú)關(guān)聲音作為主語(yǔ)音進(jìn)行識(shí)別。輕的卡屏嚴(yán)重的單詞不盡如人意。
比如這就像讓一個(gè)廚師做飯一樣,但是你給他的食材是模糊的原料,甚至還有其他東西可以炒出來(lái)的菜也很奇怪。翻譯系統(tǒng)也是如此。如果語(yǔ)音信號(hào)不干凈,即使是最先進(jìn)的大模型也無(wú)法準(zhǔn)確恢復(fù)原來(lái)的意圖。
技術(shù)的第一步不是“翻得像母語(yǔ)”,而是“收得足夠干凈”。如果收音機(jī)的根本原因是錯(cuò)誤的,無(wú)論后面的大模型有多強(qiáng),“聰明的女人沒(méi)有米飯很難做飯”。
在嘈雜的環(huán)境中怎樣聽(tīng)“對(duì)”聲?
如何讓翻譯耳機(jī)在展會(huì)、機(jī)場(chǎng)、地鐵等高噪音環(huán)境中“聽(tīng)得清楚”?更進(jìn)一步,如何讓它只聽(tīng)你的聲音?這是時(shí)空水壺第一個(gè)克服的關(guān)鍵問(wèn)題:矢量降噪技術(shù)。
傳統(tǒng)的降噪耳機(jī)通常是“壓背景音”,通過(guò)消音和降音來(lái)對(duì)抗環(huán)境噪音。然而,這種方法在多聲源和復(fù)雜回聲的場(chǎng)景中仍然顯得無(wú)能為力。因?yàn)榉植磺迥膫€(gè)聲音是你想說(shuō)的。
而且時(shí)空壺的矢量降噪,改變了思路。這并非“消音”,而是“辨人”:通過(guò)三麥克風(fēng)陣列配合空間算法,可以準(zhǔn)確鎖定每個(gè)聲音的方向和距離,只接收這個(gè)角度的語(yǔ)音信號(hào),實(shí)時(shí)屏蔽其他影響音。
比如你在展會(huì)上和法國(guó)客戶聊天,周?chē)际侵形牧奶?,背景廣播,來(lái)來(lái)往往的腳步聲。普通耳機(jī)“迷茫”,分不清該聽(tīng)誰(shuí)的。時(shí)空壺可以聰明地推斷出你是“主說(shuō)話人”,只收集你的聲音,自動(dòng)降低所有其他噪音。
更好的是,在中英雙向交流中,矢量降噪也可以智能地“劃分角色”:只輸入我們演講者的聲音,不會(huì)受到對(duì)方耳機(jī)聲音的反串影響。就像對(duì)話雙方都配備了專(zhuān)屬翻譯,只為“用人單位”服務(wù),從不串臺(tái)。
從技術(shù)角度來(lái)看,這一突破不是錦上添花,而是雙向同聲傳譯能否正常運(yùn)行的基礎(chǔ)。如果沒(méi)有“聽(tīng)到準(zhǔn)確性”,無(wú)論翻得多快,都只是“錯(cuò)誤的高速導(dǎo)出”。
所以,狐妹認(rèn)為時(shí)空壺真正亮眼的不是翻得有多快,聲音有多自然,而是讓機(jī)器第一次擁有“選擇性聽(tīng)力”:在擁擠的人群中,耳機(jī)只聽(tīng)你一個(gè)人說(shuō)話,就像貼身一樣。 AI 翻譯助手,不跑偏,不打岔,不出戲。
“理解”還不夠,大模型幫助“翻得準(zhǔn)”
聽(tīng)清楚聲音,只是 AI 第一步是翻譯。
很多人用過(guò)傳統(tǒng)的翻譯軟件,應(yīng)該也有類(lèi)似的感受:雖然翻譯出來(lái)的句子每一個(gè)字都是對(duì)的,但是聽(tīng)起來(lái)總是很尷尬,不是我們平時(shí)說(shuō)話的方式。問(wèn)題是“只翻字,不翻意思”。
語(yǔ)言從來(lái)不是單詞對(duì)詞的轉(zhuǎn)換。一個(gè)句子放在不同的上下文中,意思可能完全不同;說(shuō)話人的語(yǔ)氣、說(shuō)話速度,甚至前后聊天內(nèi)容的關(guān)系,都會(huì)影響他們真正想表達(dá)的意思。
在解決了“聽(tīng)”的問(wèn)題之后,時(shí)空壺還在“翻”的體驗(yàn)上向前邁進(jìn)了一大步。
內(nèi)置時(shí)空壺 AI 大模型不再是單詞對(duì)應(yīng),而是像母語(yǔ)者一樣,先了解你話中的語(yǔ)義、意圖和情境,然后用最自然、最恰當(dāng)?shù)姆绞皆俅伪磉_(dá)出來(lái)。
它可以自動(dòng)關(guān)聯(lián)對(duì)話的前后文本,準(zhǔn)確判斷歧義詞的含義,并根據(jù)說(shuō)話人的語(yǔ)速和語(yǔ)氣調(diào)整翻譯節(jié)奏,使對(duì)話不像冰冷的“翻譯”。
例如:在一次商務(wù)電話會(huì)議上,顧客用英語(yǔ)說(shuō)了一句“” Let ’ s table this for now ",傳統(tǒng)翻譯可以直接翻譯成"現(xiàn)在讓我們把這張桌子擺好",讓人摸不著頭腦。
但是時(shí)空壺的大模型結(jié)合上下文,明白這句話的意思是“我們暫時(shí)擱置這個(gè)話題”,翻譯中文的時(shí)候自然會(huì)傳達(dá)出正確的意思。這樣溝通更順暢,避免了誤會(huì)。
由于多模態(tài)態(tài),這種“再表達(dá)”的能力 AI、先進(jìn)技術(shù)的融合,如自然語(yǔ)言理解和前后文建模,使語(yǔ)言模型從“詞的組合”躍升到“意義的傳遞”。
這是一種微妙的感覺(jué)。很多用過(guò)的人常說(shuō):“它不像是死板的翻譯,而是在理解之后才說(shuō)出來(lái)?!?/p>
從實(shí)驗(yàn)室到日常生活:時(shí)空壺 L3 同聲傳譯已經(jīng)成為現(xiàn)實(shí)
過(guò)去,談起 AI 在同聲翻譯中,很多人的第一反應(yīng)是“實(shí)驗(yàn)室里的黑科技”。雖然技術(shù)是新的,但感覺(jué)障礙和應(yīng)用門(mén)檻很高,離我們的現(xiàn)實(shí)生活還有很長(zhǎng)的路要走。
但是這些年變化很快。早在 2021 2000年,時(shí)空壺率先推出業(yè)內(nèi)首個(gè)“矢量降噪”架構(gòu):它不僅是“降噪”,還能準(zhǔn)確鎖定主要演講者。在擁擠的環(huán)境中,比如地鐵、機(jī)場(chǎng)、展覽,也能清晰地捕捉到你的聲音,實(shí)現(xiàn)“聽(tīng)得清楚”的關(guān)鍵突破。
如果你聽(tīng)清楚了,你必須“準(zhǔn)確地翻譯”。這就更難了:機(jī)器不僅要理解字面意思,還要理解前后文字、口語(yǔ)習(xí)慣甚至文化背景。
為了解決這類(lèi)問(wèn)題,時(shí)空壺在推進(jìn)行業(yè)標(biāo)準(zhǔn)的同時(shí)迭代翻譯模型——他們參與建立類(lèi)似自動(dòng)駕駛的“ AI “同傳能力分級(jí)系統(tǒng)”。
從最初的 L1(只有文本翻譯)、L2(語(yǔ)音提示但延遲較大),到目前為止。 L3 等級(jí),時(shí)空壺已經(jīng)實(shí)現(xiàn)了“基本語(yǔ)音同傳”:延遲保持在 5 秒內(nèi),支持多語(yǔ)言、多角色雙向?qū)υ?,并能處理真?shí)的表達(dá)方式,使翻譯聽(tīng)起來(lái)更加自然,不“翻車(chē)”。
目前,時(shí)空壺的耳機(jī)可以在嘈雜的地方穩(wěn)定運(yùn)行,也可以連接在線會(huì)議系統(tǒng),實(shí)現(xiàn)遠(yuǎn)程同聲傳譯。商務(wù)旅行、跨國(guó)會(huì)議、出境旅行甚至外語(yǔ)學(xué)習(xí)的使用場(chǎng)景正在迅速拓寬。AI 同聲傳譯,正從“能用”走向“好用”。
他們的目標(biāo)當(dāng)然不止于此。下一個(gè)挑戰(zhàn),就是邁向 L4 在這個(gè)階段,翻譯像真人一樣自然,甚至可以識(shí)別說(shuō)話人的情緒和語(yǔ)氣,調(diào)整表達(dá)風(fēng)格,讓機(jī)器像個(gè)人翻譯一樣“觀察人的感受”。因此,時(shí)空壺團(tuán)隊(duì)正在開(kāi)發(fā)多場(chǎng)景前后文字識(shí)別、情感語(yǔ)音合成、方言和口音適應(yīng)等關(guān)鍵能力。
可說(shuō),時(shí)空壺正在進(jìn)入 AI 翻譯領(lǐng)域的“無(wú)人區(qū)”。這條路并不容易,但正是因?yàn)樗麄兊膱?jiān)持和深度培育,這款“寶藏產(chǎn)品”才得以被越來(lái)越多的人使用,甚至《新聞網(wǎng)》也被深度報(bào)道。
技術(shù)落地,最大的浪漫,就是把復(fù)雜的事情做成幾乎讓人忘記它有多復(fù)雜。時(shí)空壺,正在“ AI 同聲傳譯“這件事,變得像日常交流一樣自然。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com




