大模型加持,搜索會(huì)更好用?
想從浩如煙海的互聯(lián)網(wǎng)上找到自己所需的信息,對(duì)于現(xiàn)在的人而言,不是更簡(jiǎn)單,而是更難了。
2020年,全球數(shù)據(jù)總量達(dá)到了驚人的51 ZB(即51萬(wàn)億GB),數(shù)字還在不斷增長(zhǎng),據(jù)預(yù)測(cè)在2025年將達(dá)到175 ZB到180 ZB之間。
驚人的數(shù)據(jù)量與豐富的載體,都讓找信息變成一件更難的事情。傳統(tǒng)搜索引擎在滿(mǎn)足用戶(hù)信息獲取需求上,顯得越來(lái)越力不從心。
在傳統(tǒng)搜索引擎瓶頸盡顯時(shí),大模型的出現(xiàn)帶來(lái)了全新可能。
繼4月17日發(fā)布天工通用大語(yǔ)言模型后,8月23日,昆侖萬(wàn)維正式推出國(guó)內(nèi)第一款融入大語(yǔ)言模型的搜索引擎——天工AI搜索,并開(kāi)啟內(nèi)測(cè)申請(qǐng)(內(nèi)測(cè)地址:tiangong.cn)。
昆侖萬(wàn)維為天工AI搜索寫(xiě)下了如下時(shí)代注腳:“我們認(rèn)為傳統(tǒng)搜索已到了奇點(diǎn)時(shí)刻,陳舊的體驗(yàn)需要被顛覆、被改變?!?/span>
被阻塞的最后一公里
搜索是互聯(lián)網(wǎng)時(shí)代人們最基礎(chǔ)的需求。
由于互聯(lián)網(wǎng)信息快速生產(chǎn)、繁殖的特性,搜索天然充當(dāng)著用戶(hù)觸達(dá)數(shù)字化信息和服務(wù)的基礎(chǔ)路徑。因此,早在互聯(lián)網(wǎng)誕生之前,第一代搜索引擎的鼻祖就已經(jīng)在加拿大誕生。
表面上看,搜索只是為了解決某個(gè)問(wèn)題,而實(shí)際上,每一個(gè)搜索請(qǐng)求背后都蘊(yùn)藏著更為現(xiàn)實(shí)而具體的需求。一旦搜索能夠更加準(zhǔn)確、個(gè)性化的應(yīng)答需求,相當(dāng)于為用戶(hù)打造了一個(gè)全知全能的超級(jí)入口。
然而,傳統(tǒng)搜索引擎的典型使用場(chǎng)景是,用戶(hù)鍵入若干關(guān)鍵詞、瀏覽眾多網(wǎng)頁(yè)、自行摘取信息點(diǎn)、再把點(diǎn)連成線,才能最終得到想要的答案。
這是因?yàn)閭鹘y(tǒng)搜索依賴(lài)于關(guān)鍵詞匹配,不具備綜合分析和細(xì)致對(duì)話的能力,難以理解用戶(hù)的真正意圖,也就很難為用戶(hù)提供深度和上下文相關(guān)的答案。
搜索引擎本是人類(lèi)在數(shù)字化世界的導(dǎo)航和地圖,如今地圖過(guò)時(shí)了,人類(lèi)需要盡快脫離信息的泥沼。
技術(shù)范式的突破為解決問(wèn)題帶來(lái)新的可能。
今年2月,微軟宣布基于ChatGPT推出全新搜索引擎的Bing和Edge瀏覽器,5月,微軟徹底打通Bing和ChatGPT之間的生態(tài)壁壘。被逼急了的谷歌很快在6月推出試驗(yàn)版AI搜索引擎Search Generative Experience防御。
資深巨頭們?cè)俣认聢?chǎng)貼身肉搏,帶來(lái)的不僅是充滿(mǎn)硝煙味兒的熱鬧,更探索出未來(lái)的方向——是的,顛覆了AI技術(shù)原有范式的大模型,不約而同成為行業(yè)顛覆傳統(tǒng)搜索引擎的突破口。
大模型雖強(qiáng)悍,但也存在“一本正經(jīng)的胡說(shuō)八道”的短板。如果能將搜索的實(shí)時(shí)性和大模型的智能性結(jié)合起來(lái),人類(lèi)將獲得迄今為止最趁手的“沖浪”工具。
國(guó)外的科技巨頭刺刀見(jiàn)紅、不斷探索之時(shí),國(guó)內(nèi)的科技公司們也沒(méi)閑著。
作為國(guó)內(nèi)第一款應(yīng)用級(jí)的落地產(chǎn)品,天工AI搜索為安定了多年的搜索行業(yè)扔下一顆重磅炸彈。這顆炸彈不僅想要打通信息高速公路與用戶(hù)之間梗阻的最后一公里,更為大模型在C端的真正落地,辟出了一條路。
四個(gè)維度,全面升級(jí)
有了大模型的加持,搜索究竟會(huì)有什么改變?百聞不如一見(jiàn),先來(lái)感受下我們的測(cè)試體驗(yàn)。
測(cè)試先從一個(gè)寬泛的問(wèn)題開(kāi)始,輸入“新加坡好玩嗎”之后,天工AI搜索開(kāi)始整活:列出幾個(gè)相關(guān)鏈接,提供了信息溯源,隨后給出了一段完整的回答。
與傳統(tǒng)搜索引擎根據(jù)關(guān)鍵詞識(shí)別檢索范圍匹配海量信息不同,基于大模型能力的AI搜索是一種生成式搜索,用戶(hù)可通過(guò)自然語(yǔ)言清晰表達(dá)自己的意圖,并獲得有效組織和提煉后的答案,不用再一個(gè)個(gè)點(diǎn)鏈接、看網(wǎng)頁(yè),為冗余信息浪費(fèi)時(shí)間。
因?yàn)樘旃I搜索確實(shí)能“聽(tīng)懂”用戶(hù)在說(shuō)什么、用戶(hù)想要什么,所以能給出完整而非碎片式信息的答案。用戶(hù)不再需要通過(guò)關(guān)鍵詞來(lái)適應(yīng)搜索引擎的工作方式,而是自然語(yǔ)言式交互讓搜索引擎以人性化方式來(lái)適應(yīng)人類(lèi)。
從尋找內(nèi)容,到獲取答案,天工AI搜索的革新性可見(jiàn)一斑。
突破了傳統(tǒng)搜索引擎短板的局限外,天工AI搜索也補(bǔ)上了大模型的短板。
傳統(tǒng)搜索的痛點(diǎn)之一,在于不同來(lái)源的海量信息帶來(lái)的大量冗余和信息不一致;與此同時(shí),大語(yǔ)言模型的生成機(jī)制,也無(wú)法完全規(guī)避“一本正經(jīng)地胡說(shuō)八道”現(xiàn)象。天工AI搜索在所有回答中加入了信源索引,以此保障答案可追溯、可考證、可信賴(lài)。同時(shí),用戶(hù)可將每輪次的搜索結(jié)果留存在天工內(nèi),便于隨時(shí)查閱回溯,也可一鍵分享給他人。
上圖“新加坡好玩嗎”的答案中,天工AI搜索便列出了6個(gè)信息溯源點(diǎn),給出的完整回答中,每一個(gè)信息點(diǎn)都關(guān)聯(lián)到了相應(yīng)的信息溯源點(diǎn),確保了信息的真實(shí)、準(zhǔn)確和有效。天工AI搜索的雙重技術(shù)保障,讓魚(yú)龍混雜的信息變得可追溯可信賴(lài)。
一個(gè)簡(jiǎn)單測(cè)試,已經(jīng)能夠看出天工AI搜索的智能升維。為了進(jìn)一步測(cè)試天工AI搜索的智能程度,我們進(jìn)行了追問(wèn),加了一個(gè)限定條件“三天時(shí)間”,希望得到旅行建議。
天工AI搜索很快給出了相應(yīng)的游玩安排,沒(méi)有機(jī)械羅列景點(diǎn),而是為每天定下相應(yīng)主題,并安排上相關(guān)的游覽路線。其中第二天行程主題是感受本地生活,非常貼近時(shí)下流行的city walk,已經(jīng)是一份十分可行且非常個(gè)性化的旅行攻略了。
測(cè)試到這還沒(méi)結(jié)束,我們進(jìn)行了第二次追問(wèn),加上了“親子友好”的限定條件。在這次追問(wèn)中,我們并沒(méi)有明確這個(gè)攻略要覆蓋幾天的行程,但天工AI搜索根據(jù)上下文的信息給出的是三天的行程攻略,顧及到了親子友好的需求。不得不說(shuō),天工AI搜索是真的很“懂”。
從這個(gè)連環(huán)追問(wèn)的表現(xiàn)來(lái)看,天工AI搜索對(duì)大模型技術(shù)的應(yīng)用,使意圖識(shí)別成為可能,用戶(hù)完全可以通過(guò)自然流暢的對(duì)話式交互來(lái)清晰表達(dá)自己的意圖,從而獲得精準(zhǔn)、有效且個(gè)性化的答案。用戶(hù)可以在搜索上獲得“量身定做”和“千人千面”式體驗(yàn),搜索從模糊走向精確,從通用走向了個(gè)性。
上面測(cè)試的搜索需求比較生活化,為了了解天工AI搜索在專(zhuān)業(yè)領(lǐng)域的表現(xiàn),我們又測(cè)試了一個(gè)更加專(zhuān)業(yè)的問(wèn)題。
在輸入了“目前電動(dòng)汽車(chē)的電池有哪些技術(shù)流派”后,天工AI搜索依舊列出了6個(gè)信息溯源點(diǎn),給出了經(jīng)過(guò)總結(jié)和提煉的答案。這個(gè)回答不僅歸納了當(dāng)前電池的主要類(lèi)別,還介紹了市場(chǎng)主流的電池類(lèi)型,以及更加前沿的電池技術(shù)。短短一段話,足以讓用戶(hù)對(duì)電池行業(yè)的現(xiàn)狀有大致了解。
并且,天工AI搜索列出的推薦追問(wèn)方向十分具體和專(zhuān)業(yè)。
當(dāng)然,既然是測(cè)試必須要加大難度,所以我們追問(wèn)的是“前沿電池技術(shù)哪個(gè)最有優(yōu)勢(shì)”,這是一個(gè)非??简?yàn)AI搜索理解、總結(jié)信息能力的問(wèn)題。而天工AI搜索沒(méi)有被難倒——沒(méi)有一本正經(jīng)的胡說(shuō)八道,天工給出了明確的回答,和充足的論據(jù),每一個(gè)論點(diǎn)都有據(jù)可依。
這個(gè)測(cè)試將AI搜索“可以根據(jù)上下文語(yǔ)義與用戶(hù)展開(kāi)多輪次、深度的對(duì)話,從而實(shí)現(xiàn)對(duì)于復(fù)雜問(wèn)題的深入研究的能力”,展現(xiàn)得淋漓盡致。
據(jù)介紹,天工AI搜索的“追問(wèn)”功能讓用戶(hù)可以就一個(gè)問(wèn)題展開(kāi)20輪次以上交互,以此展開(kāi)深度探索。
此外,大模型使得AI搜索具備了整合、提煉、串聯(lián)信息的能力,因此AI搜索能更好地應(yīng)對(duì)開(kāi)放式問(wèn)題,在處理知識(shí)類(lèi)以及創(chuàng)意類(lèi)搜索時(shí),其體驗(yàn)與效率將遠(yuǎn)勝于傳統(tǒng)搜索引擎。
基于人類(lèi)反饋強(qiáng)化學(xué)習(xí)(RLHF)進(jìn)行訓(xùn)練的大語(yǔ)言模型,更進(jìn)一步提升了AI搜索的答案對(duì)于人的價(jià)值。
這些都使得天工AI搜索實(shí)現(xiàn)了從信息到知識(shí)的躍升。
從尋找內(nèi)容到獲取答案;從魚(yú)龍混珠到可追溯和信賴(lài);從模糊到精確,從通用到個(gè)性;從信息到知識(shí),與傳統(tǒng)搜索引擎相比,天工AI搜索的升級(jí)是全方位的,可以說(shuō)是升維打擊。它是如何做到的?
1+1的化學(xué)反應(yīng)
天工AI搜索跨越式進(jìn)化的秘密,在于技術(shù)范式的突破。跳脫出了傳統(tǒng)搜索引擎的技術(shù)路徑,天工AI搜索采用了全新的技術(shù)框架。
與傳統(tǒng)搜索引擎相比,天工AI搜索為用戶(hù)省去了瀏覽、摘取、整理信息的過(guò)程,能直接給出完整的回答。相較大模型,天工AI搜索又可以實(shí)時(shí)獲取互聯(lián)網(wǎng)信息,能夠利用最新的互聯(lián)網(wǎng)信息回答需要實(shí)時(shí)信息的問(wèn)題。
而且,天工AI搜索將支持多模態(tài)搜索,除了文字,AI搜索還支持圖像、語(yǔ)音等多種輸入方式,允許用戶(hù)通過(guò)各種方式搜索信息。據(jù)了解,圖片搜索會(huì)在多模態(tài)大模型下一個(gè)版本中上線。在全新的技術(shù)框架下,不同載體的信息都可以被天工AI搜索連接、理解并呈現(xiàn)。
用戶(hù)終于不再需要在海量網(wǎng)頁(yè)中辛苦的尋找答案了,天工AI搜索能為用戶(hù)提供更高效、更個(gè)性化、交互更簡(jiǎn)單的搜索服務(wù),人類(lèi)在數(shù)字世界的信息迷宮里,終于有了一個(gè)全自動(dòng)導(dǎo)航。
得以如此智能,離不開(kāi)大模型技術(shù)的加持。同時(shí),原有的搜索引擎技術(shù)還能修正大模型現(xiàn)有的不足。通過(guò)將大模型和搜索引擎結(jié)合,天工AI搜索既解決了大模型胡編亂造的問(wèn)題,又能夠分析用戶(hù)的真實(shí)意圖,具備比傳統(tǒng)的搜索引擎更強(qiáng)的理解能力。
也就是說(shuō),大模型的智能與搜索引擎的及時(shí)被合二為一,天工AI搜索將人找信息的模式,切換到了“信息找人”的模式。
不再性感的搜索引擎被大模型注入了新想象,而搜索引擎也補(bǔ)足了大模型的短板,新舊技術(shù)范式產(chǎn)生的化學(xué)反應(yīng),造就了“天工”,也探出了大模型的下凡路。
以搜索這種用戶(hù)最為習(xí)慣的應(yīng)用形態(tài)為媒介,昆侖萬(wàn)維為大模型嵌入更多人的日常,鋪平了道路。與搜索本身的迭代相比,這是更為重要的價(jià)值。
搜索引擎走出搜索
人機(jī)對(duì)話早已不是新奇玩意,AI賦能搜索也并不是新鮮話題,評(píng)估天工AI搜索的價(jià)值,既要看其技術(shù)框架,也要看其未來(lái)空間。
大模型是天工AI搜索實(shí)現(xiàn)跨代際搜索體驗(yàn)的功臣。有了大模型的助力,天工AI搜索才能真正“懂”了。
作為天工AI搜索背后的功臣,天工大模型本身就是一個(gè)狠角色。
天工大模型采用了雙千億級(jí)大語(yǔ)言模型,具備了更高級(jí)的自主學(xué)習(xí)和智能涌現(xiàn)能力。天工大模型背后還有國(guó)內(nèi)最大的GPU集群之一,能夠進(jìn)行充分訓(xùn)練。
在此基礎(chǔ)上,天工采用了蒙特卡洛搜索樹(shù)算法進(jìn)行優(yōu)化,這進(jìn)一步提高了解碼過(guò)程中的準(zhǔn)確性和安全性,這是天工在復(fù)雜任務(wù)和場(chǎng)景中能夠快速且準(zhǔn)確響應(yīng)指令,讓用戶(hù)感受到其足夠“聰明”、“通人性”的關(guān)鍵原因之一。
為了給天工最優(yōu)質(zhì)的燃料,天工團(tuán)隊(duì)投入大量資源從數(shù)十萬(wàn)億的數(shù)據(jù)中清洗、篩選出了3萬(wàn)億單詞數(shù)據(jù)用于訓(xùn)練大模型。這使得天工天然“更懂中文”。
有了大模型的助力,“天工AI搜索”塑造“搜索鏈接一切”的邊界能力,從人和服務(wù)拓展到任意需求和答案。真正做到了信息孤島時(shí)代,降低搜索難度,實(shí)現(xiàn)知識(shí)遷移,對(duì)信息重新組織、整理、進(jìn)行輸出,最大程度降低時(shí)間成本,獲取高質(zhì)量信息,提高決策效率。這蘊(yùn)藏著解碼天工價(jià)值空間的關(guān)鍵線索。
無(wú)論技術(shù)如何進(jìn)化,搜索本質(zhì)上是一個(gè)工具,如果工具的能力更加豐富,自然會(huì)深入嵌入用戶(hù)的日常生活。
現(xiàn)在,天工AI搜索將搜索引擎升級(jí)為解決方案輸出者,搜索的邊界和價(jià)值也迎來(lái)了重估時(shí)刻——無(wú)論是材料收集、文案撰寫(xiě)、科研學(xué)習(xí)、智力外腦,乃至為生活提供全天候服務(wù)的生活管家,小小的搜索框?qū)⒊蔀橛脩?hù)的生產(chǎn)力助手。
可以推測(cè),伴隨AI搜索的智能化程度持續(xù)提升,天工AI搜索必將集聚更多用戶(hù)和開(kāi)發(fā)者,催生更為豐富立體的應(yīng)用場(chǎng)景和產(chǎn)品。
比如,當(dāng)用戶(hù)搜索“孕晚期血糖偏高晚餐適合吃什么”時(shí),天工AI搜索不僅能給出具體的建議,還能給出相關(guān)食品的購(gòu)買(mǎi)鏈接,輸出一體化解決方案。
當(dāng)需求都可以通過(guò)一個(gè)搜索框解決,AI搜索作為大模型時(shí)代的應(yīng)用端基礎(chǔ)設(shè)施和超級(jí)流量入口的潛力也隨之浮現(xiàn)。
盡管以搜索框的形態(tài)出現(xiàn),很容易被人歸類(lèi)到工具中,但體驗(yàn)過(guò)之后就會(huì)明白,AI搜索是全然不同于傳統(tǒng)搜索引擎的新物種,其具備成為AI時(shí)代超級(jí)入口的誘人前景。當(dāng)前,天工AI搜索“小荷才露尖尖角”,但作為率先掌握并推出了AI搜索的玩家,天工已經(jīng)為自己打開(kāi)了全新的價(jià)值空間。
技術(shù)的進(jìn)步從來(lái)不是一蹴而就,但關(guān)鍵的變化往往只取決于幾個(gè)瞬間。天工AI搜索已經(jīng)扇動(dòng)了蝴蝶的翅膀,更大的風(fēng)暴已在醞釀。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com