第一個AI應(yīng)用王小川來了,一手評價:有特色,但不完美。
昨天,百川智能發(fā)布了新一代底座大模型。 Baichuan 第四,同時推出了第一款 AI 應(yīng)用-百小應(yīng)用。
百川智能瞄準(zhǔn)的是AI智能助手,就像市場上大多數(shù)大型廠商一樣。有趣的是,雖然它被定位為AI。 智能化助手,但是百小應(yīng)的主要特征是「懂得搜索,會提問」。這個問題和現(xiàn)在一樣火爆 AI 類似的搜索應(yīng)用。
強調(diào)搜索特征并不奇怪。王小川是中國最了解搜索的人之一,他創(chuàng)造的搜狗長期穩(wěn)居搜索行業(yè)第二名。AI搜索是AI應(yīng)用的三大場景,甚至OpenAI也在布局。
令人好奇的是,從移動互聯(lián)網(wǎng)到生成AI,王小川是如何理解搜索產(chǎn)品的變化的?百小應(yīng)該和市面上的AI搜索產(chǎn)品有什么區(qū)別?在百小應(yīng)上線的第一時間,烏鴉君開始使用它。今天,你可以跟隨烏鴉君,先探索水。
01 理解搜索,但不僅僅是搜索
從定位上看,百川推出的“百小應(yīng)”是一款類似ChatGPT的產(chǎn)品、Kimi的智能助手產(chǎn)品不僅可以隨時回答客戶提出的各種問題,如快速閱讀文檔、整理數(shù)據(jù)、協(xié)助創(chuàng)作等。,還具有多輪搜索、定向搜索等搜索能力。
產(chǎn)品本身還具有多模式相關(guān)功能。用戶可以上傳照片、pdf等文檔,讓百小要區(qū)分內(nèi)容,完成相應(yīng)的指令,比如寫文案。
要說百小應(yīng)該和市面上的智能助手產(chǎn)品最大的區(qū)別就是搜索功能。用王小川的話來說,“百小應(yīng)該”的一個主要特點就是可以讓模型學(xué)會“多輪搜索”。
什么是“多輪搜索”?多輪搜索是指百小時應(yīng)該能夠進一步探索用戶提出的問題的核心答案。與單輪搜索相比,多輪搜索可以在市場調(diào)研、產(chǎn)業(yè)分析等復(fù)雜場景中有效獲得更專業(yè)、更深入的信息。
在搜索結(jié)果呈現(xiàn)方面,與其他簡單總結(jié)一次搜索后網(wǎng)頁信息的應(yīng)用不同,百小應(yīng)該直接將搜索結(jié)果應(yīng)用到問答結(jié)果中作為觀點和論據(jù),以表格等結(jié)構(gòu)化的形式呈現(xiàn)搜索結(jié)果,優(yōu)化信息布局,方便用戶快速定位和解讀所需信息。
盡管以“搜索”功能為特征,但百川并不希望將其視為搜索。 AI的產(chǎn)品。用王小川的話說,“如果搜索結(jié)果簡單總結(jié),搜索公司可以自己做,而不是創(chuàng)業(yè)公司?!睆拈L遠來看,AI助手將從AI“工具”升級為“合作伙伴”。
換言之,與市場上直接給出搜索結(jié)果的搜索產(chǎn)品相比,百小應(yīng)該更愿意將搜索作為與用戶互動的場景。
02 搜索功能一手評價:有特色,但不完美。
打開百小應(yīng)用程序,將直接出現(xiàn)一個對話框,這也是搜索功能的入口。
為更好地感受百小應(yīng)與市場上AI搜索產(chǎn)品的區(qū)別,我們通過三個問題來解決百小應(yīng)的AI。 對實用性進行了搜索測試。
第一個問題是楊立昆對AGI的看法。對于這個看似不難的問題,百小應(yīng)的回答令人驚訝:
楊立昆教授是中國科學(xué)院自動化研究所的研究人員。與此同時,百小應(yīng)無法給出楊立昆的觀點,因為他無法打開最新的數(shù)據(jù)庫,也無法提供最新的觀點。
相比之下,秘塔AI和Perplexity的表現(xiàn)要好得多。
秘塔不僅給出了楊立昆的一些核心觀點,還梳理了觀點,形成了一個大綱。答案后面,還有與楊立昆相關(guān)的內(nèi)容和事件科普。
盡管Perplexity不能像秘塔那樣詳細,但至少可以給出一些核心觀點,這是基本合格的。
甚至Kimi也和Kimi一樣被定位為AI助手,至少給出了楊立昆的一些基本信息和一般觀點。
第二個問題是,AI搜索和傳統(tǒng)搜索有什么區(qū)別?關(guān)于這個問題,秘塔的表現(xiàn)一如既往的穩(wěn)定,包括整體總結(jié)和重點分類。
Perplexity直接給出了AI搜索和傳統(tǒng)搜索的六個不同之處,從重點總結(jié)來看,Perplexity和秘塔略有不同。
讓我們看看百小應(yīng)的表現(xiàn)。百小應(yīng)也給出了五個區(qū)別:搜索結(jié)果的相關(guān)性、交互技術(shù)、學(xué)習(xí)和優(yōu)化、搜索結(jié)果的呈現(xiàn)和搜索引擎的智能化。
不僅如此,百小還根據(jù)用戶AI搜索的信息需求進一步提供了百度和谷歌在AI搜索領(lǐng)域的實際應(yīng)用案例。至少在這個問題上,百小應(yīng)該沒有落后于與秘塔和Perplexity的對比。
在這里,烏鴉君又問了一個問題:在AI搜索中,秘塔和百度哪個更有優(yōu)勢?百小應(yīng)沒有直接下結(jié)論,而是給出了秘塔和百度各自的優(yōu)勢,甚至做了一個表格。更多樣化的結(jié)構(gòu)化呈現(xiàn)形式也是百小應(yīng)的一大特色。
從前兩個問題來看,與秘塔和Perplexity相比,百小應(yīng)該在信息準(zhǔn)確性方面不穩(wěn)定。如果你想的話 AI 與持續(xù)的對話和實時性相比,搜索真正應(yīng)用于工作中,答案的準(zhǔn)確性是首選。
所以,在最后一次測試中,烏鴉君特意挖了一個坑,問了一個完全不存在的數(shù)據(jù):2010年拼多多的用戶數(shù)量?
百小不僅沒有上套,而且直接戳破了這一套:拼多多成立于2015年9月,所以2010年沒有用戶信息。
Perplexity也沒有上套,不僅給出了正確的信息,而且還給出了更多關(guān)于拼多多用戶表達的信息點。
烏鴉君沒想到的是,之前表現(xiàn)不錯的秘塔在這個問題上頭暈?zāi)垦!km然秘塔在總結(jié)中說不能給拼多多2010年的數(shù)據(jù),但在總結(jié)中還是給出了一個錯誤的事實:拼多多成立于2010年。
經(jīng)過三輪測試,除了Perplexity表現(xiàn)穩(wěn)定外,百小應(yīng)和秘塔在信息準(zhǔn)確性上都“翻車”,相比之下,百小應(yīng)的錯誤更加嚴(yán)重。
楊立昆AGI觀點的事實錯誤,部分原因是模型知識庫造成的信息實時性不足。
舉例來說,在我問百小應(yīng)問題的時候,評價一下GPT-4o?百小應(yīng)會回答,數(shù)據(jù)知識更新日期是2023年,沒有相關(guān)信息。但是,如果把類似的問題交給秘塔和Perplexity,他們可以給出最新的GPT-4o信息。
這與百小應(yīng)的市場定位密切相關(guān)。百小應(yīng)的定位類似于ChatGPT的個人助手,這意味著它的信息收集取決于模型訓(xùn)練數(shù)據(jù),而AI搜索可以實時捕捉到最新的網(wǎng)絡(luò)信息,因此在信息實時性方面更有優(yōu)勢。同樣的Kimi無法給出GPT-4o的評價。
據(jù)其它媒體報道,百小應(yīng)該提問時,搜索功能可能不會觸發(fā)。然而,這種設(shè)計令人驚訝:
雖然定位為個人助手,但百小在宣傳時應(yīng)該注意的是,搜索技術(shù)與大模型緊密結(jié)合?!爸浪阉鞯腁I助手”也是百小應(yīng)的口號。但在實際使用過程中,即時信息的獲取無法像市場上的AI搜索那樣完成,對用戶體驗影響很大。
當(dāng)然,考慮到百小應(yīng)該剛剛上線,這些不健全也可以理解,希望后面的產(chǎn)品能有進一步的改進。
本文來自微信微信官方賬號“禿鷲智能說”(ID:wuyazhinengshuo),作者:智能禿鷲,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com