AI原生硬件首戰(zhàn):阿里以眼鏡作答,定義超級入口
在大模型從生成邁向完成的階段,所有科技公司都在思索同一個問題:AI真正融入人類生活,會從何處開啟?是網(wǎng)頁、App,還是某種隨身新終端?答案逐漸明晰:硬件,或許是AI原生時代至關(guān)重要的起點。
大型科技公司正借助AI硬件探索下一代入口形態(tài)。這些嘗試達成了一個共識:手機未必是AI的最佳載體,屏幕難以承載持續(xù)的對話、感知與主動服務(wù)。
對AI有足夠野心的科技大公司不會放棄硬件領(lǐng)域。
在此背景下,阿里巴巴在2025世界人工智能大會上推出了首款自研AI眼鏡——夸克AI眼鏡。

自去年AI硬件成為行業(yè)熱點,發(fā)布會、演示不斷涌現(xiàn)。但此次發(fā)布,不僅是一款消費電子產(chǎn)品的亮相,更是阿里整合AI To C業(yè)務(wù)后,首次將AI能力融入物理終端的實際行動。
阿里成為繼Meta之后,全球第二家以大模型能力驅(qū)動智能眼鏡落地的科技平臺型公司。
AI+硬件+生態(tài)協(xié)同:阿里全棧能力的實體化載體
阿里正積極布局C端用戶場景通路。2024年底,通義APP并入阿里智能信息事業(yè)群,與夸克共同推進AI to C戰(zhàn)略,夸克被確定為阿里的AI旗艦應(yīng)用。這一架構(gòu)調(diào)整,初步規(guī)劃了阿里在大模型時代的戰(zhàn)略方向。
進入2025年,夸克成為該系統(tǒng)中最明確且具潛力的接口:
3月,夸克升級為“AI超級框”,成為融合對話、搜索、執(zhí)行與決策的智能任務(wù)中樞,不再是傳統(tǒng)搜索框;
6月高考期間,夸克推出“高考深度搜索”等功能,累計生成超1200萬份個性化志愿報告,三四線考生占比過半;
7月,在“AI+健康”競爭激烈的背景下,夸克健康大模型通過國內(nèi)12門核心學(xué)科主任醫(yī)師級評測,成為首個進入消費級產(chǎn)品體系的“主任級AI醫(yī)生”。
夸克的每次突破,都是早期長期投入的成果??淇薃I眼鏡的推出,也是水到渠成之事。
夸克承接這一任務(wù)并非偶然。作為阿里體系內(nèi)少有的“中立型”工具產(chǎn)品,夸克在年輕群體中口碑良好,在語音、語義、圖像等底層能力上積累深厚,其在搜索、健康、教育等場景驗證過的產(chǎn)品 - 算法耦合機制,使其成為AI助手形態(tài)的理想落地載體。
早在2025年1月,就有報道稱夸克團隊在探索AI眼鏡。此次,阿里選擇以眼鏡為突破口,進軍大模型時代的硬件終端賽道。
這不僅是產(chǎn)品亮相,更是阿里AI to C戰(zhàn)略的具象表達。AI眼鏡被定義為超級入口的物理載體,旨在打造具備感知與行動能力的隨身AI助手。
這一定位反映了阿里對新一代終端形態(tài)的判斷:下一個入口不應(yīng)是軟硬件簡單拼湊的產(chǎn)物,而應(yīng)是“模型+硬件+生態(tài)”一體化能力的閉環(huán)輸出。
具體而言,夸克AI眼鏡融合了阿里多維度的能力:
硬件方面,夸克AI眼鏡團隊有豐富的終端經(jīng)驗,核心成員多來自硬件行業(yè);
軟件與算法上,夸克在語音識別、語義理解和圖像問答方面的能力,已在App中得到驗證,并基于通義千問構(gòu)建了多款垂直場景模型;
最終,結(jié)合飛豬旅行、阿里商旅等生態(tài)能力,形成從場景、指令、調(diào)用到反饋的多環(huán)協(xié)同鏈路。
這些能力賦予了夸克AI眼鏡區(qū)別于同類產(chǎn)品的核心特征??淇薃I眼鏡負責(zé)人宋剛表示,它首先要是一副好戴的眼鏡,其次是全天候可用的智能終端,最重要的是成為隨身的AI超級助手?!拔覀儼殉堿I助手排在第一位?!?/p>
從設(shè)備到助手,不僅是口號,更體現(xiàn)在功能定義上。團隊未從顯示端突破,而是聚焦語音交互、第一視角拍攝等“高頻剛需”場景,早期著重打造可持續(xù)使用的基礎(chǔ)能力。
實際交互中,夸克AI眼鏡搭載語音與多模態(tài)大模型,具備語義理解等核心能力。即便現(xiàn)實條件與測試環(huán)境有差異,其識別與響應(yīng)表現(xiàn)也較為穩(wěn)定。
結(jié)合阿里業(yè)務(wù),還能拓展更多場景,如基于骨傳導(dǎo)的聲紋支付,利用人體健康、運動數(shù)據(jù)作為多模態(tài)輸入。
宋剛表示:“我們可以提供閉環(huán)的體驗?!?/p>
綜合能力使夸克AI眼鏡從單一拍攝設(shè)備,轉(zhuǎn)變?yōu)槟馨殡S用戶生活、工作的個人助手。
路徑和邏輯清晰,執(zhí)行落地才是難題。對阿里而言,這不僅是對新硬件形態(tài)的探索,更是驗證其AI全棧能力能否閉環(huán)的關(guān)鍵戰(zhàn)役。
探尋一副眼鏡的邊界
喬布斯曾說:“用戶無法預(yù)測沒見過的產(chǎn)品。只有看到產(chǎn)品,用戶才能給出有用反饋。”
如今,普通消費者仍難以想象AI硬件的最終形態(tài)。大模型對C端用戶的影響,大多還局限于手機屏幕。
無論是Ray - Ban Meta還是夸克AI眼鏡,巨頭們都在尋找下一代終端,一個能改變交互方式、兼具入口與出口功能的物理形態(tài)。
夸克AI眼鏡不想簡單移植App,也不復(fù)制Ray - Ban Meta,而是進行全新交互邏輯的嘗試。

雖然Meta也在做眼鏡,但兩者邏輯不同。Ray - Ban Meta側(cè)重輕社交、拍照分享,強調(diào)“記錄”;而夸克AI眼鏡更注重理解與執(zhí)行,是“理解你面對的世界”,更像新的AI助手。
正因如此,并非所有公司都適合做夸克AI眼鏡。
產(chǎn)品定義圍繞“高頻生活場景”展開。AI眼鏡響應(yīng)的是用戶“看不清、記不住、解不出”的通用需求。如在飛豬旅行場景中,用戶詢問“我?guī)c登機”,眼鏡可自動顯示登機口信息,若疊加高德室內(nèi)導(dǎo)航,全程可語音指引。
這類場景背后,是阿里內(nèi)部多個部門與夸克組建的專項開發(fā)團隊。他們以“Agent”化為導(dǎo)向深度定制,推動業(yè)務(wù)從被動響應(yīng)轉(zhuǎn)向主動服務(wù)。飛豬、高德等都已開展類似合作,構(gòu)建不同生活場景的微型AI鏈路。
只有阿里能做好這件事,因為阿里多年來已打通衣食住行各方面事務(wù),生態(tài)完備,只需激活。其他公司即便想法很好,也常因通路問題難以落地。
在功能實現(xiàn)上,AI眼鏡普遍面臨的能力邊界正被逐步突破。
語音交互方面,夸克AI眼鏡配備5個麥克風(fēng)+骨傳導(dǎo)系統(tǒng),能在嘈雜環(huán)境精準(zhǔn)喚醒,通過通義千問理解指令,自研中控系統(tǒng)智能分發(fā),降低響應(yīng)延遲。圖像問答場景下,結(jié)合自研算法與百億級圖像檢索能力,識別響應(yīng)速度與答案質(zhì)量更高。
多模態(tài)能力整合,使夸克AI眼鏡在拍照之外更具理解能力,能在多種場景為用戶提供即時講解。
不過,邊界不止于此。
互聯(lián)網(wǎng)公司做硬件常忽視硬件本身。Web和App時代的成功讓他們習(xí)慣快速迭代,但這不利于硬件產(chǎn)品研發(fā),因為硬件開發(fā)周期長。
好在夸克團隊有硬件人才,能解決硬件需求和瓶頸。設(shè)計上,采用可拔插鏡腿與隨身換電倉,實現(xiàn)全天候續(xù)航;配備雙芯片系統(tǒng)控制功耗;使用輕量材料,優(yōu)化佩戴體驗,減少壓迫感。
團隊深知挑戰(zhàn)復(fù)雜。宋剛表示:“AI眼鏡體驗鏈路長,不能有明顯短板,否則體驗不閉環(huán),用戶難以信任產(chǎn)品。”
AI眼鏡作為新終端,不是簡單堆疊功能,而是要在人與世界間找到高效、可信賴的交互方式。
入口之爭即范式之爭
其實,硬件作為AI入口的嘗試并非僅在眼鏡領(lǐng)域。2017年,中國互聯(lián)網(wǎng)大廠就開啟了智能音箱之爭。
但當(dāng)時AI能力有限,音箱雖能接收指令、喚醒,但難以執(zhí)行復(fù)雜任務(wù)。
大模型的出現(xiàn)改變了這一切。新的人機交互形式或許正在誕生,新終端應(yīng)是能時刻感知、搶先理解的載體。
手機是主動使用的設(shè)備,需手動操作才能交互;而AI時代理想的終端應(yīng)默認在線,先理解再行動。
眼鏡具有比手機更優(yōu)的第一視角感知能力,配合大模型可實時識別世界、主動推送信息,替代復(fù)雜操作。
AI眼鏡的意義或許不在于成為爆款硬件,而在于成為下一代操作系統(tǒng)的物理接口。
因此,全球科技平臺公司都關(guān)注AI硬件,本質(zhì)上是在探尋AI強大后,如何讓其隨時可用,入口在哪里。
如今,阿里通過夸克AI眼鏡邁出的這一步,正是對這一問題的系統(tǒng)性回應(yīng)。
本文來自微信公眾號“智能涌現(xiàn)”,作者:曉曦,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





