對話百度文庫鐘昊:AI 重塑內(nèi)容創(chuàng)作生態(tài)之路
在當(dāng)下,當(dāng)大模型從技術(shù)奇點(diǎn)邁向產(chǎn)業(yè)基座,智能體從實(shí)驗(yàn)室走入產(chǎn)線診室,人工智能的第三次浪潮正以銳不可當(dāng)之勢重構(gòu)全球經(jīng)濟(jì)格局。中國在這場變革中具有雙重優(yōu)勢,既是超大規(guī)模應(yīng)用場景的試驗(yàn)田,又在芯片突圍、算法開源等關(guān)鍵領(lǐng)域發(fā)起沖鋒。一條獨(dú)具東方特色的 AI 發(fā)展路徑正加速形成。
7 月 26 日,以“智能時代 同球共濟(jì)”為主題的世界人工智能大會(WAIC 2025)盛大舉行,眾多科技巨頭、學(xué)術(shù)先鋒與政策制定者齊聚一堂。這場涵蓋技術(shù)、倫理、藝術(shù)的盛會,標(biāo)志著 AI 已從“產(chǎn)業(yè)變量”轉(zhuǎn)變?yōu)椤拔拿鞒A俊薄?/p>
36 氪不僅作為產(chǎn)業(yè)觀察者,更以產(chǎn)業(yè)連接者的身份深度參與此次大會,在展館搭建了“氪星直播間”,通過對話的形式,揭開人工智能產(chǎn)業(yè)進(jìn)階的底層邏輯。在對談中,百度文庫產(chǎn)品負(fù)責(zé)人鐘昊透露,百度文庫經(jīng)過 AI 重構(gòu),能精準(zhǔn)理解用戶意圖、高效滿足用戶需求,一站式解決用戶問題。百度文庫從一開始就采用 MoE(混合專家模型)架構(gòu),并通過 Genflow 進(jìn)行全局調(diào)度,旨在讓 AI 成為人類的得力助手,助力用戶更好地進(jìn)行內(nèi)容創(chuàng)作與消費(fèi)。
以下是對談實(shí)錄,經(jīng) 36 氪編輯整理:
36kr:請先介紹一下您自己和業(yè)務(wù)情況。
鐘昊:我是百度文庫的產(chǎn)品負(fù)責(zé)人。大家熟知百度文庫是個資料庫,經(jīng)過兩年多的 AI 重構(gòu),我們將 AI 能力與專業(yè)資料深度融合。如今百度文庫是一站式 AI 內(nèi)容獲取和創(chuàng)作平臺,擁有幾百個多模態(tài) AI Agent,能端到端解決用戶的創(chuàng)作難題。大家可以到 APP 或 PC 端網(wǎng)頁體驗(yàn)全新的百度文庫。
36kr:參加這次 WAIC 有什么感受和收獲?
鐘昊:百度文庫網(wǎng)盤今年也參展了。AI 行業(yè)發(fā)展迅猛,大模型在不斷進(jìn)化,文生文、文生圖、視頻等模態(tài)的應(yīng)用邊界大幅拓展,有很多有趣的應(yīng)用展示。無論是初創(chuàng)企業(yè)還是大公司,都加大了投入。今年的展會可謂百花齊放,既有共識之處,也有突破邊界的嘗試。我更期待看到更多有想象力的突破,而非過早陷入局部最優(yōu)或短期共識的解決方案。
36kr:哪個展臺給您留下的印象最深刻?
鐘昊:每個展臺都有特色,文庫網(wǎng)盤更注重場景化和端到端解決具體問題。我們最早關(guān)注的是用戶對最終交付內(nèi)容的采納率和使用率。文庫和網(wǎng)盤的展臺按用戶場景設(shè)計(jì),在學(xué)習(xí)、辦公、生活、娛樂等不同場景下,都有相應(yīng)的解決方案,讓用戶的需求得到充分滿足。
36kr:在百度文庫 AI 重構(gòu)過程中,最大的技術(shù)難點(diǎn)是什么?最好用的 AI 功能是哪個?
鐘昊:最好用且最深入的功能是智能 PPT,我們在國內(nèi)率先推出這一能力,針對十幾個場景進(jìn)行了細(xì)化。用戶不僅能根據(jù)指令生成 PPT,還能基于圖片、文檔、素材甚至個人網(wǎng)盤內(nèi)容生成,支持上傳和自定義模板,還能直接生成圖表、數(shù)據(jù)等?;谥悄?PPT 的思路,我們將其拓展到多個場景,現(xiàn)在文庫能生成長短文、研報(bào)、思維導(dǎo)圖、AI 繪本、海報(bào)等。技術(shù)難點(diǎn)在于,文庫的 AI 重構(gòu)不僅要構(gòu)建 AI agent,更要理解用戶意圖,讓 AI 智能調(diào)度多個 Agent 解決問題。比如大學(xué)新生策劃社團(tuán)活動方案,可能不會明確提出具體需求,AI 需要根據(jù)專業(yè)內(nèi)容和類似場景解決方案,主動提供綜合交付,調(diào)度不同 Agent 完成任務(wù)。這對技術(shù)要求極高,需要深入挖掘用戶需求,具備場景挖掘、需求理解和解決方案的能力,同時還需要細(xì)顆粒度、靈活的 Agent 以及 AI 閱讀器、編輯器等基建支持。
36kr:百度文庫作為國民級產(chǎn)品,經(jīng)歷 AI 原生重構(gòu)后,帶來了哪些顛覆性變化?
鐘昊:最大的變化是,過去作為資料庫,百度文庫只能滿足用戶部分需求,用戶下載內(nèi)容后需求往往未得到完全解決?,F(xiàn)在,文庫不僅能高效找到內(nèi)容,還能從零開始或基于現(xiàn)有內(nèi)容完成綜合任務(wù)。通過 AI 實(shí)時人機(jī)交互理解需求,借助 AI 融合編輯器等基建,用戶可邊思考邊創(chuàng)作,調(diào)度 AI 完成任務(wù)。用戶無需切換多個軟件,在一個應(yīng)用中就能快速完成工作,產(chǎn)品從資料庫轉(zhuǎn)變?yōu)橐徽臼狡脚_,這正是用戶所期望的。
36kr:大模型結(jié)合 AI 技術(shù)時,會面臨成本、效果、時延等“不可能三角”問題,文庫網(wǎng)盤是如何解決的?
鐘昊:百度文庫重構(gòu)時采用了 MoE 架構(gòu)。當(dāng)時行業(yè)流行 Prompt 工程,但我們發(fā)現(xiàn)其難以突破模型能力邊界,還會遇到“不可能三角”問題。我們先針對具體場景優(yōu)化 Agent,在每個場景中找到最佳平衡點(diǎn),局部解決“不可能三角”問題。例如 PPT 配圖時,直接調(diào)取文庫內(nèi)容可能又好又快。在分場景的細(xì)節(jié)打磨中,我們找到了最佳平衡點(diǎn),讓用戶能快速獲得高質(zhì)量交付。在此基礎(chǔ)上,我們推出 GenFlow 調(diào)度中樞,即將推出 2.0 版本。GenFlow 能根據(jù)用戶意圖自動調(diào)度 Agent 解決問題,選擇更“多快好省”的方案。最底層是 MoE,中間是細(xì)分場景 Agent 打磨,實(shí)現(xiàn)局部最佳平衡,再通過 Genflow 全局調(diào)度。理解用戶需求和意圖是解決問題的關(guān)鍵,只有貼近場景、用心打磨,才能找到最優(yōu)解。
36kr:這其實(shí)是在具體場景內(nèi)靈活調(diào)整。
鐘昊:沒錯,通過 PMF 滿足用戶需求。比如文庫的研報(bào)能力剛上線時,為避免生成冗余內(nèi)容,我們根據(jù)用戶需求調(diào)整,既節(jié)約成本時間,又解決了“不可能三角”問題。很多時候,答案就在場景細(xì)節(jié)中,沉下心打磨才能更接近目標(biāo)。
36kr:能做到這一點(diǎn),還是基于百度在 AI 技術(shù)上的積累。
鐘昊:是的,我們投入較早,堅(jiān)持采用 MOE 架構(gòu)。作為應(yīng)用端產(chǎn)品,我們在文心系列模型基礎(chǔ)上探索邊界,將技術(shù)積累與用戶和場景相結(jié)合,讓技術(shù)發(fā)揮最大價(jià)值。
36kr:GenFlow 是如何將模型轉(zhuǎn)化為生產(chǎn)力的?在多智能體協(xié)作上有什么優(yōu)勢?
鐘昊:我們構(gòu)思 GenFlow 是為了解決用戶不了解平臺眾多能力的問題。很多用戶帶著訴求與 AI 交互,但普通用戶沒必要挖掘所有功能,AI 應(yīng)更主動提供服務(wù)。我們希望 AI 像人一樣主動工作,在交互中允許用戶追問和提建議,并行提供解決方案,多線程處理工作。GenFlow 2.0 版本將推出干預(yù)模式、并行模式和主動思考能力,能主動挖掘用戶過往溝通內(nèi)容和記憶庫,并行處理多個任務(wù)。這是我們在行業(yè)中的創(chuàng)新,目前大多數(shù) AI 是串行解決任務(wù),而我們實(shí)現(xiàn)了并行處理,推出干預(yù)模式讓用戶可隨時打斷、補(bǔ)充、修改內(nèi)容,AI 能根據(jù)用戶歷史對話和授權(quán)資料主動靈活解決問題,流暢交流。我們的出發(fā)點(diǎn)是解決人機(jī)交互問題,目標(biāo)是讓 AI 更主動、全面地服務(wù)人類。
36kr:展望未來 3 到 5 年,隨著技術(shù)成熟,行業(yè)會有哪些變化?戰(zhàn)略上會有新部署嗎?
鐘昊:未來人機(jī)交互將更加深入全面,滲透到工作、學(xué)習(xí)、生活、娛樂各個領(lǐng)域,交互方式的邊界將更加模糊,更多是人類與 AI 共同完成任務(wù)。就像文庫、網(wǎng)盤推出 GenFlow,我們希望 AI 成為人類的好伙伴,幫助大家更好地進(jìn)行內(nèi)容創(chuàng)作和消費(fèi)。未來,我們可能會嘗試新的辦公和學(xué)習(xí)形式,無需電腦,用一個便攜設(shè)備就能在短時間內(nèi)完成復(fù)雜工作。在娛樂方面,AI 能將小說輕松轉(zhuǎn)化為動畫,降低創(chuàng)作門檻,讓每個人的創(chuàng)意都能得到展現(xiàn)。AI 能理解用戶需求,推薦優(yōu)質(zhì)內(nèi)容,提高效率,節(jié)省時間。我非常期待這樣一個充滿創(chuàng)造力的新世界。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com