大型模型加持,搜索會(huì)更好用?
對(duì)現(xiàn)在的人來說,要從浩如煙海的因特網(wǎng)上找到自己需要的信息,并非更簡(jiǎn)單,而是更加困難。
2020年,全球數(shù)據(jù)總量達(dá)到驚人的51 ZB(也就是51萬億GB),數(shù)字仍在持續(xù)增長(zhǎng),據(jù)預(yù)測(cè),2025年將達(dá)到1755。 ZB到180 ZB之間。
驚人的信息量和豐富的載體使得找到信息變得困難。傳統(tǒng)搜索引擎越來越無能為力,以滿足用戶的信息收集需求。
過去,當(dāng)搜索引擎瓶頸盡顯時(shí),大型模型的出現(xiàn)帶來了全新的可能性。
8月23日,昆侖萬偉在4月17日發(fā)布天工通用大語言模型后,正式推出了國(guó)內(nèi)首個(gè)融入大語言模型的搜索引擎——天工AI搜索,并打開內(nèi)測(cè)申請(qǐng)(內(nèi)測(cè)地址:tiangong.cn)。
昆侖萬維為天工AI搜索寫下了以下時(shí)代的注腳:“我們認(rèn)為傳統(tǒng)搜索已經(jīng)到了一個(gè)奇點(diǎn)時(shí)刻,舊的感覺需要被顛覆和改變?!?/p>
最后一公里被堵住了
在網(wǎng)絡(luò)時(shí)代,搜索是每個(gè)人最基本的需求。
由于互聯(lián)網(wǎng)信息的快速生產(chǎn)和繁殖,搜索自然充當(dāng)用戶訪問數(shù)字信息和服務(wù)的基本路徑。因此,第一代搜索引擎的鼻祖早在互聯(lián)網(wǎng)誕生之前就誕生在加拿大。
表面上看,搜索只是為了解決某些問題,而實(shí)際上,每個(gè)搜索請(qǐng)求背后都包含著更現(xiàn)實(shí)、更具體的需求。一旦搜索能夠更準(zhǔn)確、更個(gè)性化地滿足需求,就相當(dāng)于為用戶打造了一個(gè)全知全能的超級(jí)入口。
然而,傳統(tǒng)搜索引擎的典型使用場(chǎng)景是,只有客戶輸入一些關(guān)鍵詞,瀏覽許多網(wǎng)頁,自己提取信息點(diǎn),然后將點(diǎn)連接成一條線,他們才能最終得到他們想要的答案。
這是因?yàn)閭鹘y(tǒng)搜索依賴于關(guān)鍵詞匹配,沒有綜合分析和詳細(xì)對(duì)話的能力,很難理解客戶的真實(shí)意圖,也很難為用戶提供深度和語境相關(guān)的答案。
在數(shù)字世界中,搜索引擎是人類的導(dǎo)航和地圖,現(xiàn)在地圖已經(jīng)過時(shí),人類需要盡快擺脫數(shù)據(jù)的沼澤。
技術(shù)突破給解決問題帶來了新的可能性。
今年2月,微軟宣布Bing和Edge瀏覽器基于ChatGPT推出全新搜索引擎。5月,微軟完全打通了Bing和ChatGPT之間的生態(tài)堡壘。被迫擔(dān)心的谷歌很快在6月推出了AI搜索引擎Search測(cè)試版 Generative Experience防御。
資深巨頭再次結(jié)束肉搏戰(zhàn),不僅帶來了充滿硝煙味道的興奮,也帶來了未來的方向——是的,顛覆了AI技術(shù)原有范式的大模型,成為行業(yè)改變傳統(tǒng)搜索引擎的突破口。
大模型雖然強(qiáng)大,但也有“一本正經(jīng)的廢話”的缺點(diǎn)。如果搜索的實(shí)時(shí)性和大模型的智能性能能夠結(jié)合起來,人類將獲得迄今為止最受歡迎的“沖浪”工具。
國(guó)外科技巨頭刺刀見紅,不斷探索,國(guó)內(nèi)科技公司也沒有閑著。
天工AI搜索作為中國(guó)第一款應(yīng)用級(jí)落地產(chǎn)品,為穩(wěn)定多年的搜索行業(yè)留下了沉重的炸彈。這枚炸彈不僅想打通信息高速公路和用戶之間最后一公里的梗塞,還想通過C端的真實(shí)落地,找到一條路。
四個(gè)維度,全新升級(jí)
在大型模型的加持下,搜索究竟會(huì)發(fā)生什么變化?百聞不如一見鐘情,先感受一下我們的檢測(cè)感受。
測(cè)試從一個(gè)廣泛的問題開始。輸入“新加坡好玩嗎?”之后,天工AI搜索開始整體工作:列出幾個(gè)相關(guān)鏈接,帶來信息追溯,然后給出一個(gè)完整的答案。
與傳統(tǒng)搜索引擎根據(jù)關(guān)鍵詞識(shí)別搜索范圍匹配大量數(shù)據(jù)不同,基于大模型能力的AI搜索是一種生成式搜索。用戶可以通過自然語言清晰地表達(dá)自己的意圖,并得到有效組織和提煉的答案。他們不需要一個(gè)接一個(gè)地鏈接和閱讀網(wǎng)頁,而是浪費(fèi)時(shí)間來冗余信息。
因?yàn)樘旃I搜索真的可以“理解”客戶在說什么,客戶想要什么,所以可以給出一個(gè)完整的答案,而不是碎片化的信息。用戶不再需要通過關(guān)鍵詞來適應(yīng)搜索引擎的工作模式,而是通過自然語言交互來適應(yīng)搜索引擎的人類。
天工AI搜索的創(chuàng)新可見一斑,從尋找內(nèi)容到得到答案。
天工AI搜索除了突破傳統(tǒng)搜索引擎短板的局限性外,還彌補(bǔ)了大模型的短板。
傳統(tǒng)搜索的痛點(diǎn)之一是不同來源的海量數(shù)據(jù)帶來的大量冗余與信息不一致;同時(shí),大語言模型的生成機(jī)制也不能完全避免“嚴(yán)重胡說八道”的現(xiàn)象。天工AI搜索在所有答案中都添加了信源搜索,以確保答案可追溯、可考證、可信賴。與此同時(shí),用戶可以在天工中保留每一輪的搜索結(jié)果,方便隨時(shí)查看回溯,也可以一鍵與他人分享。
在圖中“新加坡好玩嗎?”在答案中,天工AI搜索列出了6個(gè)信息追溯點(diǎn)。在給出的完整答案中,每個(gè)信息點(diǎn)都與相應(yīng)的信息追溯點(diǎn)相關(guān)聯(lián),以確保信息的真實(shí)性、準(zhǔn)確性和有效性。天工AI搜索的雙重技術(shù)保障,使得魚龍混雜的信息可追溯可信。
一個(gè)簡(jiǎn)單的測(cè)試顯示了天工AI搜索的智能提升。為了進(jìn)一步檢測(cè)天工AI搜索的智能水平,我們提出了“三天”的限制,希望得到旅游建議。
天工AI搜索很快給出了相應(yīng)的游玩安排。與其機(jī)械地列出景點(diǎn),不如每天設(shè)置相應(yīng)的主題,安排相關(guān)的旅游路線。第二天的行程主題是感受當(dāng)?shù)氐纳?,非常接近時(shí)下流行的小組。 walk,已是一個(gè)非??尚星曳浅€(gè)性化的旅行策略。
測(cè)試還沒有結(jié)束,我們進(jìn)行了第二次提問,加上了“親子友好”的限制。在這次提問中,我們沒有明確這個(gè)策略要覆蓋幾天的行程,但是天工AI搜索根據(jù)前后的信息給出了三天的行程策略,考慮到了親子友好的需求。不得不說,天工AI搜索真的很“懂”。
從這一系列問題的表現(xiàn)來看,天工AI搜索對(duì)大模型技術(shù)的應(yīng)用使得意圖識(shí)別成為可能,客戶可以通過自然流暢的對(duì)話交互清晰地表達(dá)自己的意圖,從而得到準(zhǔn)確、有效、個(gè)性化的答案。使用者可在搜索中獲得“量身定做”和“定向推廣”的感覺,搜索由模糊向精確,由通用向個(gè)性轉(zhuǎn)變。
以上測(cè)試搜索需求比較生活化,為了了解天工AI搜索在專業(yè)領(lǐng)域的表現(xiàn),我們又測(cè)試了一個(gè)更專業(yè)的問題。
天工AI搜索在輸入“目前電動(dòng)汽車的電池技術(shù)系統(tǒng)是什么”后,仍然列出了六個(gè)信息追溯點(diǎn),并給出了總結(jié)和提煉的答案。這個(gè)答案不僅總結(jié)了目前電池的主要類別,還介紹了市場(chǎng)上主流的電池類型和更前沿的電池技術(shù)。短短一段話,用戶就能對(duì)電池行業(yè)的現(xiàn)狀有一個(gè)大概的了解。
并且,天工AI搜索列出的推薦追問方向非常具體和專業(yè)。
當(dāng)然,由于測(cè)試必須增加難度,我們問的是“哪種前沿電池技術(shù)最有優(yōu)勢(shì)”,這是對(duì)AI搜索理解和信息總結(jié)能力的極大考驗(yàn)。但是天工AI搜索并沒有被難住——沒有嚴(yán)重的廢話,天工給出了明確的答案和充分的論據(jù),每一個(gè)論點(diǎn)都有證據(jù)可查。
該測(cè)試生動(dòng)地展示了AI搜索“可以根據(jù)前后語義與用戶進(jìn)行多輪、深入的對(duì)話,從而實(shí)現(xiàn)對(duì)復(fù)雜問題的深入研究能力”。
根據(jù)介紹,天工AI搜索的“追問”功能使用戶能夠?qū)σ粋€(gè)問題進(jìn)行20輪以上的交互,從而進(jìn)行深度探索。
此外,大模型促使人工智能搜索具有整合、提煉和連接信息的能力,因此人工智能搜索可以更好地應(yīng)對(duì)開放式問題。在處理知識(shí)和創(chuàng)意搜索時(shí),其體驗(yàn)和效率將遠(yuǎn)遠(yuǎn)優(yōu)于傳統(tǒng)搜索引擎。
根據(jù)人類反饋加強(qiáng)學(xué)習(xí)(RLHF)大語言模型的實(shí)踐,進(jìn)一步提高了AI搜索答案對(duì)人的價(jià)值。
所有這些都促使天工AI搜索實(shí)現(xiàn)了從信息到知識(shí)的飛躍。
從尋找內(nèi)容到得到答案;從魚龍混珠到可追溯和信任;從模糊到準(zhǔn)確,從通用到個(gè)性;與傳統(tǒng)搜索引擎相比,天工AI搜索的升級(jí)是全方位的,可以算是升級(jí)的打擊。這是怎么做到的?
1 1的化學(xué)變化
天工AI搜索跳躍性進(jìn)化的秘訣在于技術(shù)范式的突破。天工AI搜索采用了全新的技術(shù)框架,跳出了傳統(tǒng)搜索引擎的技術(shù)路徑。
與傳統(tǒng)搜索引擎相比,天工AI搜索可以直接給出完整的答案,避免用戶瀏覽、提取和整理信息的過程。與大模型相比,天工AI搜索可以實(shí)時(shí)獲取互聯(lián)網(wǎng)信息,可以利用最新的互聯(lián)網(wǎng)信息回答需要實(shí)時(shí)信息的問題。
此外,天工AI搜索將支持多模式搜索。除了文字,AI搜索還支持圖像、語音等多種輸入方式,允許用戶通過各種方式搜索信息。據(jù)了解,圖片搜索將在下一個(gè)版本的多模式模型中推出。在全新的技術(shù)框架下,天工AI搜索可以連接、理解和呈現(xiàn)不同載體的信息。
最后,客戶不再需要在大量網(wǎng)頁中努力尋找答案。天工AI搜索可以為用戶提供更高效、更個(gè)性化、更簡(jiǎn)單的互動(dòng)搜索服務(wù)。在數(shù)字世界的信息謎宮里,人類終于有了全自動(dòng)導(dǎo)航。
沒有大模型技術(shù)的加持,智能是不可或缺的。同時(shí),原有的搜索引擎技術(shù)也可以調(diào)整目前大模型的不足。通過將大模型與搜索引擎相結(jié)合,天工AI搜索不僅解決了大模型編造的問題,還分析了客戶的真實(shí)意圖,具有比傳統(tǒng)搜索引擎更強(qiáng)的理解能力。
換句話說,大型智能和搜索引擎的及時(shí)合二為一,天工AI搜索將人們尋找信息的方式轉(zhuǎn)化為“尋找信息”的方式。
不再性感的搜索引擎被大模型注入了新的想象,搜索引擎也彌補(bǔ)了大模型的不足。新舊技術(shù)范式的化學(xué)變化造就了“天工”,也延伸了大模型的下凡之路。
以搜索這種客戶最習(xí)慣的應(yīng)用形式為媒介,昆侖萬偉為大模式嵌入了更多人的日常生活,鋪平了道路。這比搜索本身的迭代更重要。
搜索引擎走出搜索
人機(jī)交換已經(jīng)不是什么新鮮事了,AI賦能搜索也不是什么新話題。評(píng)價(jià)天工AI搜索的價(jià)值,不僅取決于其技術(shù)框架,還取決于其未來空間。
大型模型是天工AI搜索實(shí)現(xiàn)跨代搜索感覺的功臣。在大型模型的幫助下,天工AI搜索才能真正“理解”。
天工大模型本身就是天工AI搜索背后的功臣。
天工大學(xué)模型采用雙千億級(jí)語言模型,具有更高的自主學(xué)習(xí)和智能出現(xiàn)能力。天工大學(xué)模型背后是中國(guó)最大的GPU集群之一,可以進(jìn)行充分的訓(xùn)練。
在此基礎(chǔ)上,天工利用蒙特卡洛搜索樹算法進(jìn)行優(yōu)化,進(jìn)一步提高了解碼過程中的準(zhǔn)確性和安全性。這是天工能夠在復(fù)雜的目標(biāo)和場(chǎng)景中快速準(zhǔn)確地響應(yīng)指令,讓用戶意識(shí)到自己足夠的“聰明”。、其中一個(gè)關(guān)鍵原因是“通人性”。
為了給天工最好的燃料,天工團(tuán)隊(duì)投入了大量的資源,從數(shù)十萬億的信息中清理和選擇了3萬億的單詞數(shù)據(jù)來訓(xùn)練大模型。這使得天工自然“更懂中文”。
借助大模型,“天工AI搜索”塑造了“搜索鏈接一切”的邊界能力,從人員和服務(wù)擴(kuò)展到隨機(jī)需求和答案。真正實(shí)現(xiàn)了信息孤島時(shí)代,降低了搜索難度,實(shí)現(xiàn)了知識(shí)遷移,重新組織、整理、導(dǎo)出了信息,最大限度地降低了時(shí)間成本,獲取了優(yōu)質(zhì)信息,提高了決策效率。這包含了解碼天工價(jià)值空間的關(guān)鍵線索。
無論技術(shù)如何進(jìn)化,搜索本質(zhì)上都是一種工具,如果工具能力更強(qiáng),自然會(huì)深入到用戶的日常生活中。
如今,天工AI搜索已經(jīng)將搜索引擎升級(jí)為解決方案的輸出者,搜索的邊界和價(jià)值也迎來了重新評(píng)估的時(shí)刻——小輸入框?qū)⒊蔀榭蛻舻纳a(chǎn)力助手,無論是材料收集、文案撰寫、科研學(xué)習(xí)、智商外腦,甚至是為生活提供全天候服務(wù)的生活管家。
可以推斷,隨著AI搜索的智能化程度不斷提高,天工AI搜索將聚集更多的人和開發(fā)者,產(chǎn)生更豐富、更立體的使用場(chǎng)景和產(chǎn)品。
比如用戶搜索“孕晚期高血糖晚餐適合吃什么”時(shí),天工AI搜索不僅可以給出具體意見,還可以給出食品購(gòu)買鏈接,導(dǎo)出一體化解決方案。
AI搜索作為大模型時(shí)代的應(yīng)用端基礎(chǔ)設(shè)施和非常流量入口的潛力也隨之浮現(xiàn),當(dāng)需求可以通過輸入框進(jìn)行處理。
雖然以輸入框的形式出現(xiàn),很容易被歸類到工具中,但經(jīng)過感受,我們會(huì)明白,AI搜索是一個(gè)與傳統(tǒng)搜索引擎完全不同的新品類,具有成為AI時(shí)代超級(jí)入口的誘人前景。目前天工AI搜索“小荷只露出尖角”,但天工作者作為第一個(gè)掌握并推出AI搜索的玩家,為自己打開了一個(gè)全新的價(jià)值空間。
技術(shù)的發(fā)展從來都不是一蹴而就的,但關(guān)鍵的變化通常只取決于幾個(gè)瞬間。天工AI搜索已經(jīng)扇動(dòng)了蝴蝶的翅膀,更多的颶風(fēng)正在考慮。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com