亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

<label id="m9wbq"></label>

<rt id="m9wbq"></rt>

<label id="m9wbq"></label>

<span id="nuc9w"></span>

印象筆記CEO唐毅：大模型競(jìng)爭(zhēng)未到下半場(chǎng)，成本下降是行業(yè)共識(shí)

商界觀察

2023-07-13

大模型的火爆不僅讓眾多大型互聯(lián)網(wǎng)公司紛紛跟進(jìn)，一批在AI領(lǐng)域有所積累的中小型公司也在探索適合自己的應(yīng)用方向。

“從有監(jiān)督學(xué)習(xí)到無監(jiān)督學(xué)習(xí)，從GPT-2到GPT-3與GPT-3.5，對(duì)企業(yè)來說，重要的不是看見某一階段性成果的驚艷瞬間，而在于從頭到尾關(guān)注技術(shù)迭代的路徑。當(dāng)?shù)竭_(dá)合適的進(jìn)入節(jié)點(diǎn)時(shí)就可以自然而然地做出決斷——OK，Let's give it a try（讓我們?cè)囋嚢桑！庇∠蠊P記董事長(zhǎng)兼CEO唐毅近日接受界面新聞專訪時(shí)這樣表示。

2018年從Evernote正式分拆獨(dú)立為中方控股企業(yè)后，印象筆記同期便成立了印象研究院，進(jìn)行自然語言處理的前沿技術(shù)探索。

圍繞文檔筆記這一核心產(chǎn)品應(yīng)用場(chǎng)景，印象筆記團(tuán)隊(duì)最早開始沿著深度學(xué)習(xí)的監(jiān)督式學(xué)習(xí)路徑，利用知識(shí)圖譜等技術(shù)構(gòu)建模型來做智能推薦、自動(dòng)標(biāo)簽、自動(dòng)摘要。等到強(qiáng)化學(xué)習(xí)面世、OpenAI開始快速迭代GPT系列模型后，印象筆記也跟進(jìn)改造自家生成式模型產(chǎn)品。

2018年至今，印象筆記前后做了近四年研究，共進(jìn)行過三次大的模型迭代升級(jí)。最新的“大象GPT”是基于開源大模型BLOOM開發(fā)的百億參數(shù)輕量級(jí)模型，今年4月正式發(fā)布。印象筆記依托自有的“APP+PC端”公開數(shù)據(jù)作基礎(chǔ)，經(jīng)過加工和混合，建立起垂直領(lǐng)域數(shù)據(jù)庫，通過預(yù)訓(xùn)練和精調(diào)來做針對(duì)解決特定行業(yè)問題的專用模型（Domain Expertise）。

對(duì)于一款會(huì)聊天、可回答腦筋急轉(zhuǎn)彎的對(duì)話機(jī)器人能否進(jìn)入特定領(lǐng)域或行業(yè)、完成更專業(yè)的工作，大模型的應(yīng)用前景分通用與專用兩條不同路線。印象筆記選擇專用而非通用，一方面考慮到基座通用大模型動(dòng)輒上億美元的訓(xùn)練成本，另一方面是出于公司以知識(shí)管理作為大模型核心落地場(chǎng)景的商業(yè)化戰(zhàn)略。

按照專用模型的理念，專業(yè)領(lǐng)域的問題要靠專用而非通用模型來解決。近期的一篇由Google Brain前科學(xué)家Maithra Raghu、Databricks CTO Matei Zaharia、Google前CEO Eric Schmid合寫的論文《一個(gè)通用大模型可以統(tǒng)治一切嗎？》總結(jié)道，諸如法律、金融、醫(yī)療這些高價(jià)值、特定領(lǐng)域的工作流程依賴豐富的專有數(shù)據(jù)集，通用模型要完成這一類工作，在工程（多樣化的微調(diào)方法、鏈接API調(diào)用、使用不同的AI組件）、成本（大型模型的適應(yīng)成本很高）和安全性（參數(shù)泄露、數(shù)據(jù)共享）方面挑戰(zhàn)極大。

針對(duì)專用模型的數(shù)據(jù)安全與隱私保護(hù)，印象筆記在訓(xùn)練、優(yōu)化“大象GPT”時(shí)全程做好數(shù)據(jù)區(qū)分與隱私保護(hù)。用于模型訓(xùn)練的數(shù)據(jù)均來自印象筆記自有的公共數(shù)據(jù)集和第三方公開渠道信息，在持續(xù)優(yōu)化過程中貫穿使用用戶授權(quán)、數(shù)據(jù)脫敏及最新隱私保護(hù)技術(shù)。

據(jù)悉，移植“大象GPT”的印象AI功能后，印象筆記的應(yīng)用使用頻次、留存率等運(yùn)營(yíng)數(shù)據(jù)均有顯著提升。首月AI上線后，45%的付費(fèi)用戶每周使用超過50次AI相關(guān)功能；新用戶的次日留存率和7日留存率較之前分別提升131%、103%；免費(fèi)老用戶和付費(fèi)老用戶留存率較之前分別提升32%、24%；大量低頻活躍用戶回流，活躍頻次有所提升。

印象筆記最開始因辦公筆記為外界熟知，但其AI布局的野心并不止步于一款應(yīng)用，而是要成為辦公協(xié)作領(lǐng)域的知識(shí)管理工具。目前，已經(jīng)上線的現(xiàn)有產(chǎn)品包括智能寫作、智能書寫、智能總結(jié)、智能文檔處理、文檔對(duì)話功能構(gòu)成了第一代AI智能助理。未來即將上線的第二代產(chǎn)品定位于“Knowledge Copilot”，能夠在多模態(tài)場(chǎng)景下完成知識(shí)的處理、回憶、獲取、搜索和鏈接，并能夠自動(dòng)生成內(nèi)容。

隨著國(guó)產(chǎn)大模型的扎堆上馬，唐毅認(rèn)為，大模型還處于定義市場(chǎng)的階段，競(jìng)爭(zhēng)遠(yuǎn)未達(dá)到“下半場(chǎng)”。在他看來，有三大趨勢(shì)現(xiàn)階段已成為共識(shí)，分別是：第一，隨著通用與專用模型的絕對(duì)數(shù)量增多，模型訓(xùn)練成本將大幅下降；第二，模型的參數(shù)數(shù)量并不直接與智能成正比。參數(shù)越多并不意味著越容易訓(xùn)練，產(chǎn)生的涌現(xiàn)能力也并非如此；第三，成本的降低是與模型的推理方式與使用場(chǎng)景有關(guān)，訓(xùn)練與部署環(huán)節(jié)上的效率提升必然會(huì)大幅降低綜合成本。

“未來各家競(jìng)爭(zhēng)拼到最后還是考驗(yàn)工程能力，包括訓(xùn)練工程、部署工程，例如模型訓(xùn)練中的數(shù)據(jù)清洗與指令數(shù)據(jù)集的優(yōu)化，模型部署中的模型壓縮與量化等等。工程化能力可以實(shí)質(zhì)性地降低成本、加快商業(yè)化落地，也是各家的功夫所在?！?/span>

本文僅代表作者觀點(diǎn)，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

努力增儲(chǔ)上產(chǎn)，20家油田曬上半年成績(jī)單

Keep香港敲鐘上市，估值超150億

“減肥針”GLP-1在國(guó)內(nèi)立項(xiàng)已超過700個(gè)，一場(chǎng)激戰(zhàn)將要來臨

市場(chǎng)監(jiān)管總局公布《食品經(jīng)營(yíng)許可和備案管理辦法》

把9.9打在門頭上，將咖啡賣到懸崖邊，獨(dú)立店開始“反卷”了？

項(xiàng)目推薦

<label id="t48zm"></label>