資本青睞AI“完整產(chǎn)業(yè)鏈”,浙新四維獲種子輪融資開啟新征程
十方融海戰(zhàn)略投資浙新四維,雙方攜手合作打造AI硬件產(chǎn)品,重點聚焦智能家居、體育、具身領域。
近日,深圳十方融??萍加邢薰緦φ阈滤木S智能科技(杭州)有限公司完成戰(zhàn)略投資,投后浙新四維估值約2億元人民幣,雙方正式達成深度戰(zhàn)略合作。
浙新四維總經(jīng)理譚雪表示,十方融海與浙新四維的合作,構建了一條從系統(tǒng)層到硬件端的完整產(chǎn)業(yè)鏈,具有極大的發(fā)展?jié)摿?,相比投資單一技術或產(chǎn)品型公司,這種合作模式可能更具價值。十方融海小智AI市場總監(jiān)杜君也認為,雙方的合作是基于多年行業(yè)積淀形成的綜合實力互補,而非單點能力。
本輪融資吸引了多家曾布局算力、大模型、機器人等前沿領域的投資機構關注,這既體現(xiàn)了資本對語音交互方向的看好,也反映出AI領域的新趨勢:資本更傾向于投資能與自身業(yè)務形成強協(xié)同的“場景化”企業(yè)。
打造“殺手級”AI硬件產(chǎn)品的秘訣
十方融海成立于2016年初,歷經(jīng)三次戰(zhàn)略升級,從知識分享平臺逐步轉型為以AI為核心的科技企業(yè),專注于AI落地應用。

杜君認為,無論是AI硬件還是AI應用,要成為“殺手級”產(chǎn)品需具備三個特征:
- 緊密結合應用場景,能夠切實解決用戶的真實需求,包括實際問題和情感需求,具有很強的場景化屬性。
- 實現(xiàn)無感知體驗,大量優(yōu)化工作的本質是降低用戶交互難度。例如,從傳統(tǒng)物理按鍵交互向語音交互轉變,就是為了讓用戶更輕松地使用產(chǎn)品。未來加入多模態(tài)交互后,AI甚至能通過用戶的眼神、動作理解需求,達到極致的“無感”體驗。
- 具備人文關懷,核心是情感智能。隨著人們對內心需求的關注度不斷提高,未來產(chǎn)品不一定功能繁多,但優(yōu)秀產(chǎn)品一定具備人文關懷能力,這將成為產(chǎn)品的基本屬性,為用戶帶來更舒適的體驗。
杜君指出,并非所有設備都要高度擬人化,但所有設備在特定環(huán)節(jié)都應具備較強的人文關懷與情緒關懷能力。此時,用戶對產(chǎn)品的付費意愿會更高,但并非單純?yōu)榍榫w價值買單。
探索硬件原生的交互系統(tǒng)
當大模型的軟件側應用受到廣泛關注時,十方融海更看好AI接入終端后對硬件進化的巨大推動作用?;谶^去教育業(yè)務中積累的大量實時語音交互、情緒感知以及大模型相關技術經(jīng)驗,十方融海在去年8月份啟動了小智AI項目。
小智AI與市面上GPT系列、Qwen系列等主流大模型有著本質區(qū)別。
首先,小智AI是硬件原生的交互系統(tǒng),更注重硬件終端的智能化。從底層架構到功能開發(fā),都是圍繞大模型在硬件場景下的最佳效果以及與產(chǎn)品的深度融合展開。目前,小智AI實現(xiàn)了平均500毫秒的快速響應、基于情緒識別的擬人化交互,并以MCP協(xié)議支持功能拓展。整套系統(tǒng)采用云端部署,有效降低了對端側的配置要求。

其次,小智AI更強調應用性和大模型在人機交互中的效果。在語音交互過程中,小智AI采用了三段式架構:ASR(語音轉文字)、LLM(大語言模型)、TTS(文字轉語音輸出)。同時,小智AI也支持通義、DeepSeek等第三方模型。
為提升人機交互的真實感與親和力,團隊圍繞C端用戶的交互體驗進行了大量優(yōu)化,尤其是在情感與情緒識別方面,對整個鏈路進行了系統(tǒng)性優(yōu)化:
- 在模型側,從用戶全量對話語料中提取出1024維人格數(shù)字特征,通過聚類與歸納壓縮為26維關鍵特征,并嵌入對話訓練集,以便在交互時識別用戶性格特點。
- 在ASR環(huán)節(jié),自主部署了優(yōu)化模型,不僅能進行語音識別,還能捕捉語氣、語調等情緒信號。系統(tǒng)會識別關鍵詞推測潛在情緒,并將這些信息傳遞給大模型,使生成的內容兼顧客觀語義與主觀情感。
- 在TTS環(huán)節(jié),將傳統(tǒng)的“擬聲”升級為“擬人”。AI在語音播報時融入情緒語調,讓表達更自然、更具溫度。
對于提供情緒價值重要的上下文能力,小智AI目前支持短期記憶,長期記憶功能在內測中,預計近期上線。杜君表示,“記憶”問題較為復雜,涉及哲學層面的思考,其中的難點在于要不斷重新理解記憶的定義、調取時機以及存在形式。因此,長期記憶功能會持續(xù)迭代。
杜君坦言,目前行業(yè)仍處于早期階段,十方融海作為國內較早將情感大模型能力融入終端設備的企業(yè),至今也僅推進了一年。盡管各行業(yè)已出現(xiàn)一些不錯的應用案例,但要實現(xiàn)市場化、商業(yè)化還需要時間,仍有很大的探索空間。
“靈魂大腦”與“身體”的完美結合
對于十方融海來說,小智AI的核心定位是硬件端的整套交互系統(tǒng),其價值的發(fā)揮離不開硬件產(chǎn)品的支持,即小智AI這個“靈魂大腦”需要硬件這個“身體”。因此,軟硬件結合是十方融海接下來做好系統(tǒng)優(yōu)化、將產(chǎn)品推向消費市場的關鍵。
與浙新四維的合作核心就在于此,雙方發(fā)揮各自優(yōu)勢:小智AI負責打磨并做好系統(tǒng)層面的工作,浙新四維則憑借多年沉淀的硬件與產(chǎn)品研發(fā)優(yōu)勢及經(jīng)驗,共同探索打造當代AI產(chǎn)品。
十方融海董事長、小智AI創(chuàng)始人黃冠表示:“我們很高興能與浙新四維這樣一支兼具技術遠見與實干精神的團隊合作。他們對多模態(tài)情感語音大模型在端側應用的深入研究,與我們對AI技術未來發(fā)展趨勢的判斷高度契合。我們相信,此次戰(zhàn)略投資將有力加速‘小智AI’技術的迭代與場景拓展,共同開啟智能交互的新篇章?!?/p>

實際上,初版完成后,小智AI在內測中在交互體驗、擬人性和響應速度上都取得了理想效果,但當時團隊并未確定其具體應用方向,而是決定先以開源的方式建立社區(qū)生態(tài),希望與社區(qū)一起探索。
目前,社區(qū)已有6萬多名開發(fā)者。在社區(qū)中,眾多開發(fā)者進行二次開發(fā)或產(chǎn)品創(chuàng)新,碰撞出了不少好想法。十方融海與浙新四維的合作探索也是在這個過程中開始的。
浙新四維是由浙江大學和新加坡管理大學聯(lián)合培養(yǎng)的博士團隊創(chuàng)立的AI創(chuàng)新企業(yè),專注于多模態(tài)情感大模型的軟硬件應用。智能家居是浙新四維的核心優(yōu)勢場景,創(chuàng)始人秦兵擁有20多年的智能家居產(chǎn)業(yè)經(jīng)驗,在浙江、四川各有一家智能制造工廠,許多智能家居頭部企業(yè)都是其客戶。因此,浙新四維能快速結合頭部客戶的新需求、新場景,將小智AI更好地應用到硬件產(chǎn)品中。
小智AI的發(fā)展速度、效率及效果表現(xiàn),已成為浙新四維的核心能力之一。浙新四維認為,下一代智能家居產(chǎn)品必然會與AI深度融合,采用語音交互這一基礎設施。值得注意的是,過去半年,雙方已經(jīng)打通了部分頭部家居品牌的不同設備。
“具身領域代表著未來”,這也是浙新四維重點關注的方向。目前具身領域多聚焦在機器人本體及智腦開發(fā)上,浙新四維認為,下一個方向是“智腦+語音交互”的結合,以此服務人形機器人本體,甚至與具身機器人的“小腦”協(xié)同。用戶不會只滿足于產(chǎn)品的工具屬性,當下正是布局的好時機。
另外一個重要場景是體育,這帶有一定的情懷色彩。創(chuàng)始團隊很多成員是多年的馬拉松愛好者,已跑完全球近100場馬拉松,體育已融入了他們的日常生活。憑借對體育行業(yè)的深刻理解,浙新四維團隊快速切入體育賽道,首創(chuàng)了AI解說智能體。
浙新四維的產(chǎn)業(yè)布局目前聚焦在這三個場景,但未來不會局限于此。
據(jù)了解,浙新四維當下的戰(zhàn)略選擇是面向B端,目的是借此打造語音交互的基礎設施。譚雪表示,語言交互持續(xù)蓬勃發(fā)展的關鍵在于:語言使用的密度和語言知識的質量。浙新四維第一步先拉通語言使用的密度——通過大量智能家居設備,提升用戶使用數(shù)量、交互人數(shù)以及交互設備數(shù)量,而相關數(shù)據(jù)和反饋也會反哺“小智AI”迭代。
但浙新四維未來會同時覆蓋B端與C端,只是目前還沒到大模型直接面向C端并實現(xiàn)快速爆發(fā)的時機。浙新四維也有相關人才儲備,像譚雪在To C領域深耕了近20年,涉及情緒價值、情感價值相關業(yè)務。她透露,養(yǎng)老陪伴可能是其未來探索的方向之一。
產(chǎn)業(yè)鏈的集體升級之路
杜君表示:“是市場發(fā)展的選擇與契機讓我們一步步明確了硬件的發(fā)展方向?!?/p>
實際上,早在去年8月小智AI剛推出時,雙方就已展開深入交流,并做出了不少落地產(chǎn)品。例如,不到半年的時間里,浙新四維在體育行業(yè)基于小智AI進行了深度二次開發(fā),成功打造出國內首創(chuàng)AI解說智能體,并應用于浙BA賽事解說,獲得全網(wǎng)廣泛關注。其次,憑借團隊在智能家居領域多年的開發(fā)與制造經(jīng)驗,浙新四維也將經(jīng)過二次開發(fā)訓練的小智AI應用于該領域,并已與若干頭部家電廠商達成合作并獲得訂單。此外,浙新四維還基于小智AI,實現(xiàn)與多款具身機器人的肢體控制及語言交互。此外,雙方還在研發(fā)其他產(chǎn)品,未來將逐步上線。
在協(xié)作過程中,兩方團隊配合緊密、節(jié)奏高效,溝通幾乎無障礙。浙新四維在客戶提出需求或出現(xiàn)硬件問題后會第一時間響應,迅速定位原因,并針對大模型能力提出創(chuàng)新性改進思路。同時,小智AI團隊也會給硬件性能優(yōu)化提出具體建議。
除研發(fā)環(huán)節(jié)外,雙方還在戰(zhàn)略層面保持高頻溝通,確保方向一致。雙方已建立完善的溝通機制,能夠迅速響應臨時項目需求。此外,雙方合作范圍也從技術拓展至市場與品牌層面,形成從技術到市場的全鏈路合作。

之前專注軟件的十方融海逐漸意識到,硬件行業(yè)的產(chǎn)業(yè)鏈條非常長,涵蓋了上游的云廠商、芯片平臺,到硬件開發(fā)商、產(chǎn)品需求方,再到渠道方、品牌方等多個角色。在杜君看來,AI硬件并非單純把AI加入硬件,而是整個產(chǎn)業(yè)鏈條的一次整體升級與進化。
在芯片層面,端云協(xié)同會成為重要發(fā)展方向。端側芯片負責本地響應與隱私保護,云端則承擔復雜計算與推理任務,二者結合已成為明確趨勢。然而,由于端側芯片成本仍偏高,其在消費級市場的大規(guī)模普及尚需時間。
在系統(tǒng)層面,以小智AI為代表的終端AIOS系統(tǒng),構建了從語音交互到任務執(zhí)行的完整閉環(huán),為用戶帶來流暢自然的體驗。這類系統(tǒng)不僅提供AI算力接口,也在逐步重構智能設備的系統(tǒng)架構。
相比之下,應用開發(fā)者生態(tài)的轉型尤為關鍵。AI應用的交互邏輯已明顯區(qū)別于傳統(tǒng)APP。開發(fā)者需重新設計應用架構、交付方式與用戶體驗,以適配自然語言或語音驅動的操作模式。未來,無論是導航、外賣、提醒工具還是工作流類應用,都將迎來基于Agent邏輯的重構。
杜君表示:“鏈條中,每個環(huán)節(jié)的角色需各司其職,不可能憑一己之力包攬所有事,合作必然是實現(xiàn)共贏的最佳方式。”這不是對原有體系的“重塑”,而是一次基于交互邏輯的再演化,整個產(chǎn)業(yè)在積極適應這種變化。
抓住機遇,盡快行動
盡管多模態(tài)情感大模型的發(fā)展前景廣闊,但落地仍面臨挑戰(zhàn)。
譚雪指出,問題主要集中在技術路徑與硬件適配上。一方面,傳統(tǒng)“先研發(fā)后推廣”路徑或不適用,浙新四維選擇以用戶需求和實際場景為出發(fā)點,反向推動技術迭代。這種“場景倒推”模式不僅提升了產(chǎn)品的市場接受度,也增強了對不確定性的應對能力。硬件適配方面,調優(yōu)雖不構成根本障礙,卻直接影響用戶體驗的順滑度。為此,系統(tǒng)必須在軟硬件協(xié)同上達到高度一致,這對整體架構提出了更高要求。
杜君從用戶視角補充道,AI硬件市場正處在認知轉變期,用戶需要一定時間去理解與接受新體驗和新交互方式,這是產(chǎn)品優(yōu)化和技術突破的必經(jīng)過程。
杜君表示:“產(chǎn)業(yè)發(fā)展或將不再完全由模型研發(fā)主導,而是更多由實際需求、場景與市場力量驅動?!倍嗄B(tài)與情感模型被視為未來的重要趨勢,其能力將逐步成為智能手表、鬧鐘等終端設備的“標配”,其廣泛滲透將模糊行業(yè)邊界,催生新的生態(tài)體系。這意味著巨大的機遇,企業(yè)應結合自身行業(yè)、產(chǎn)品與技術積累,積極探索將AI轉化為業(yè)務的第二增長引擎。
譚雪預測,多模態(tài)情感大模型將在未來三年迎來爆發(fā),并涌現(xiàn)具備全球影響力的頭部品牌。這類模型有望成為“全球化的基礎交互設施”,不僅在推動AI在中國的落地,也將在全球范圍內催生新的應用范式,尤其在智能終端結合、二次開發(fā)與垂類模型訓練方面潛力顯著。
因此,她呼吁從業(yè)者不必等待,而應盡快行動:打磨團隊、明確場景、加速落地、搶占先機。只有在早期階段建立優(yōu)勢,才能在未來的行業(yè)爆發(fā)中掌握主動權。
本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。
免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com

 
  
