亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

印象筆記CEO唐毅:大模型競(jìng)爭(zhēng)未到下半場(chǎng),成本下降是行業(yè)共識(shí)

商界觀察
2023-07-13

大模型的火爆不僅讓眾多大型互聯(lián)網(wǎng)公司紛紛跟進(jìn),一批在AI領(lǐng)域有所積累的中小型公司也在探索適合自己的應(yīng)用方向。

 

“從有監(jiān)督學(xué)習(xí)到無監(jiān)督學(xué)習(xí),從GPT-2到GPT-3與GPT-3.5,對(duì)企業(yè)來說,重要的不是看見某一階段性成果的驚艷瞬間,而在于從頭到尾關(guān)注技術(shù)迭代的路徑。當(dāng)?shù)竭_(dá)合適的進(jìn)入節(jié)點(diǎn)時(shí)就可以自然而然地做出決斷——OK,Let's give it a try(讓我們?cè)囋嚢桑!庇∠蠊P記董事長(zhǎng)兼CEO唐毅近日接受界面新聞專訪時(shí)這樣表示。

 

2018年從Evernote正式分拆獨(dú)立為中方控股企業(yè)后,印象筆記同期便成立了印象研究院,進(jìn)行自然語言處理的前沿技術(shù)探索。

 

圍繞文檔筆記這一核心產(chǎn)品應(yīng)用場(chǎng)景,印象筆記團(tuán)隊(duì)最早開始沿著深度學(xué)習(xí)的監(jiān)督式學(xué)習(xí)路徑,利用知識(shí)圖譜等技術(shù)構(gòu)建模型來做智能推薦、自動(dòng)標(biāo)簽、自動(dòng)摘要。等到強(qiáng)化學(xué)習(xí)面世、OpenAI開始快速迭代GPT系列模型后,印象筆記也跟進(jìn)改造自家生成式模型產(chǎn)品。

 

2018年至今,印象筆記前后做了近四年研究,共進(jìn)行過三次大的模型迭代升級(jí)。最新的“大象GPT”是基于開源大模型BLOOM開發(fā)的百億參數(shù)輕量級(jí)模型,今年4月正式發(fā)布。印象筆記依托自有的“APP+PC端”公開數(shù)據(jù)作基礎(chǔ),經(jīng)過加工和混合,建立起垂直領(lǐng)域數(shù)據(jù)庫,通過預(yù)訓(xùn)練和精調(diào)來做針對(duì)解決特定行業(yè)問題的專用模型(Domain Expertise)。

 

 

 

 

對(duì)于一款會(huì)聊天、可回答腦筋急轉(zhuǎn)彎的對(duì)話機(jī)器人能否進(jìn)入特定領(lǐng)域或行業(yè)、完成更專業(yè)的工作,大模型的應(yīng)用前景分通用與專用兩條不同路線。印象筆記選擇專用而非通用,一方面考慮到基座通用大模型動(dòng)輒上億美元的訓(xùn)練成本,另一方面是出于公司以知識(shí)管理作為大模型核心落地場(chǎng)景的商業(yè)化戰(zhàn)略。

 

按照專用模型的理念,專業(yè)領(lǐng)域的問題要靠專用而非通用模型來解決。近期的一篇由Google Brain前科學(xué)家Maithra Raghu、Databricks CTO Matei Zaharia、Google前CEO Eric Schmid合寫的論文《一個(gè)通用大模型可以統(tǒng)治一切嗎?》總結(jié)道,諸如法律、金融、醫(yī)療這些高價(jià)值、特定領(lǐng)域的工作流程依賴豐富的專有數(shù)據(jù)集,通用模型要完成這一類工作,在工程(多樣化的微調(diào)方法、鏈接API調(diào)用、使用不同的AI組件)、成本(大型模型的適應(yīng)成本很高)和安全性(參數(shù)泄露、數(shù)據(jù)共享)方面挑戰(zhàn)極大。

 

針對(duì)專用模型的數(shù)據(jù)安全與隱私保護(hù),印象筆記在訓(xùn)練、優(yōu)化“大象GPT”時(shí)全程做好數(shù)據(jù)區(qū)分與隱私保護(hù)。用于模型訓(xùn)練的數(shù)據(jù)均來自印象筆記自有的公共數(shù)據(jù)集和第三方公開渠道信息,在持續(xù)優(yōu)化過程中貫穿使用用戶授權(quán)、數(shù)據(jù)脫敏及最新隱私保護(hù)技術(shù)。

 

據(jù)悉,移植“大象GPT”的印象AI功能后,印象筆記的應(yīng)用使用頻次、留存率等運(yùn)營(yíng)數(shù)據(jù)均有顯著提升。首月AI上線后,45%的付費(fèi)用戶每周使用超過50次AI相關(guān)功能;新用戶的次日留存率和7日留存率較之前分別提升131%、103%;免費(fèi)老用戶和付費(fèi)老用戶留存率較之前分別提升32%、24%;大量低頻活躍用戶回流,活躍頻次有所提升。

 

印象筆記最開始因辦公筆記為外界熟知,但其AI布局的野心并不止步于一款應(yīng)用,而是要成為辦公協(xié)作領(lǐng)域的知識(shí)管理工具。目前,已經(jīng)上線的現(xiàn)有產(chǎn)品包括智能寫作、智能書寫、智能總結(jié)、智能文檔處理、文檔對(duì)話功能構(gòu)成了第一代AI智能助理。未來即將上線的第二代產(chǎn)品定位于“Knowledge Copilot”,能夠在多模態(tài)場(chǎng)景下完成知識(shí)的處理、回憶、獲取、搜索和鏈接,并能夠自動(dòng)生成內(nèi)容。

 

隨著國(guó)產(chǎn)大模型的扎堆上馬,唐毅認(rèn)為,大模型還處于定義市場(chǎng)的階段,競(jìng)爭(zhēng)遠(yuǎn)未達(dá)到“下半場(chǎng)”。在他看來,有三大趨勢(shì)現(xiàn)階段已成為共識(shí),分別是:第一,隨著通用與專用模型的絕對(duì)數(shù)量增多,模型訓(xùn)練成本將大幅下降;第二,模型的參數(shù)數(shù)量并不直接與智能成正比。參數(shù)越多并不意味著越容易訓(xùn)練,產(chǎn)生的涌現(xiàn)能力也并非如此;第三,成本的降低是與模型的推理方式與使用場(chǎng)景有關(guān),訓(xùn)練與部署環(huán)節(jié)上的效率提升必然會(huì)大幅降低綜合成本。

 

“未來各家競(jìng)爭(zhēng)拼到最后還是考驗(yàn)工程能力,包括訓(xùn)練工程、部署工程,例如模型訓(xùn)練中的數(shù)據(jù)清洗與指令數(shù)據(jù)集的優(yōu)化,模型部署中的模型壓縮與量化等等。工程化能力可以實(shí)質(zhì)性地降低成本、加快商業(yè)化落地,也是各家的功夫所在?!?/span>

 

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com