生成人工智能:發(fā)展演變和產(chǎn)業(yè)機(jī)遇
在2022年11月30日OpenAI發(fā)布ChatGPT時(shí),沒(méi)有人會(huì)意識(shí)到,未來(lái)6個(gè)月,新一代人工智能浪潮將給人類社會(huì)帶來(lái)眩暈的變化。自2010年代初深度學(xué)習(xí)問(wèn)世以來(lái),人工智能已進(jìn)入第三次高潮。2017年,Transformer算法將深度學(xué)習(xí)推向了一個(gè)大模型時(shí)代?;赥ransformer的Decoder部分,OpenAI建立了GPT家族。
ChatGPT一出現(xiàn)就風(fēng)靡全球。每個(gè)人都驚訝于它能夠連貫深入地交談。同時(shí),他們也驚訝地發(fā)現(xiàn),它出現(xiàn)了反映智力的能力,如推理和思維鏈。隨著AI預(yù)訓(xùn)練模型的不斷發(fā)展,人工智能的生成內(nèi)容 (AIGC) 隨著算法的不斷創(chuàng)新和多模態(tài)AI的日益主流,以ChatGPT為代表的AIGC技術(shù)加速成為AI領(lǐng)域的最新發(fā)展方向,推動(dòng)AI迎來(lái)下一個(gè)大發(fā)展、大繁榮的時(shí)代,將對(duì)經(jīng)濟(jì)社會(huì)的發(fā)展產(chǎn)生重大影響。
AIGC 技術(shù)的定義和背景
AIGC(Artificial Inteligence Generated Content),指通過(guò)人工智能技術(shù)一鍵生成內(nèi)容的生產(chǎn)方法。通過(guò)訓(xùn)練模型生成與訓(xùn)練數(shù)據(jù)相似的新內(nèi)容。與以識(shí)別和預(yù)測(cè)當(dāng)前數(shù)據(jù)為主的傳統(tǒng)類型AI不同,AIGC側(cè)重于創(chuàng)建新的、新穎的數(shù)據(jù)。其關(guān)鍵原理是學(xué)習(xí)和理解數(shù)據(jù)的分布,從而生成具有相似特征的新數(shù)據(jù),廣泛應(yīng)用于圖像、文本、音頻、視頻等領(lǐng)域。目前AIGC最引人注目的應(yīng)用是ChatGPT。ChatGPT是基于OpenAI企業(yè)的大型語(yǔ)言模型GPT-3.5訓(xùn)練、調(diào)整、優(yōu)化聊天機(jī)器人應(yīng)用,同一AI模型可處理各種文字推理任務(wù)。ChatGPT發(fā)布僅兩個(gè)月就獲得了1億個(gè)月的用戶,超過(guò)了歷史上所有互聯(lián)網(wǎng)客戶應(yīng)用軟件的用戶增長(zhǎng)速度。AIGC技術(shù)以大型語(yǔ)言模型和圖像生成模型為代表,已成為新一代人工智能的平臺(tái)技術(shù),幫助不同行業(yè)實(shí)現(xiàn)價(jià)值飛躍。
在AIGC爆發(fā)的背后,人們普遍認(rèn)為AI技術(shù)在三個(gè)領(lǐng)域的發(fā)展為AI技術(shù)提供了肥沃的土壤,即生成算法、預(yù)訓(xùn)練模型和多模態(tài)技術(shù)。
首先,隨著各種生成算法的不斷創(chuàng)新和突破,AI現(xiàn)在可以生成各種類型的內(nèi)容和信息,如文本、代碼、圖像、語(yǔ)音和視頻對(duì)象。AIGC和過(guò)去最明顯的區(qū)別在于AIGC的分析。(Analytical AI)發(fā)展成生成式AI(Generative AI)。分析AI模型是根據(jù)現(xiàn)有數(shù)據(jù)進(jìn)行分析、判斷和預(yù)測(cè)的。最典型的應(yīng)用之一是智能內(nèi)容推薦;生成AI模型是在學(xué)習(xí)現(xiàn)有數(shù)據(jù)后解讀和創(chuàng)建新內(nèi)容。
其次,預(yù)訓(xùn)練模型,也就是常說(shuō)的大模型,導(dǎo)致了AIGC技術(shù)能力的質(zhì)變。過(guò)去,研究人員需要對(duì)每個(gè)類型的任務(wù)進(jìn)行獨(dú)立的AI模型訓(xùn)練,訓(xùn)練好的模型只能從事特定的任務(wù),不具有實(shí)用性。而且大型預(yù)訓(xùn)練模型技術(shù)顯著提高了AIGC模型的通用性和工業(yè)化水平,使AIGC模型成為自動(dòng)化內(nèi)容生產(chǎn)的“工廠”和“流水線”。包含ChatGPT的生成AI模型、GPT-四等大語(yǔ)言模型(Large Language Models,LLM)和Midjourney、Stable 圖像生成模型,如Diffusion,又稱基礎(chǔ)模型,(Foundation Models),這是一種基于各種海量數(shù)據(jù)預(yù)訓(xùn)練的深度學(xué)習(xí)算法,表現(xiàn)出強(qiáng)大的、更泛化的語(yǔ)言邏輯和內(nèi)容生成能力。
使用大型語(yǔ)言模型(LLM)例如,通過(guò)大量的網(wǎng)絡(luò)媒體數(shù)據(jù)練習(xí),語(yǔ)言模型的參數(shù)值可以達(dá)到1萬(wàn)億甚至100萬(wàn)億。這大大增強(qiáng)了語(yǔ)言模型的生成能力,同一語(yǔ)言模型可以高質(zhì)量地完成各種文本推理任務(wù),如寫(xiě)詩(shī)、寫(xiě)文章、講故事、敲代碼、提供專業(yè)知識(shí)等。因此,大型模型已經(jīng)成為各大企業(yè)追求的AI方向。
第三,多模態(tài)AI技術(shù)的發(fā)展。多模態(tài)技術(shù)使AIGC模型能夠跨模態(tài)生成各種類型的內(nèi)容,例如將文本轉(zhuǎn)換為照片和視頻。進(jìn)一步提高了AIGC模型的通用性。[1]
下面是AIGC領(lǐng)域的一些基本技術(shù):
1)產(chǎn)生對(duì)抗網(wǎng)絡(luò)(GAN, Generative Adversarial Networks):Ian是GAN 2014年,Goodfellow等人提出了一種生成模式。它由生成器(Generator)和判別器(Discriminator)兩個(gè)部分組成。生成器負(fù)責(zé)生成新數(shù)據(jù),判別器負(fù)責(zé)判斷生成數(shù)據(jù)與真實(shí)數(shù)據(jù)的相似程度。通過(guò)不斷的訓(xùn)練,生成器可以生成越來(lái)越逼真的數(shù)據(jù)。
二是變分自編碼器(VAE, Variational Autoencoders):VAE是一種基于概率生成模型的生成方法,它通過(guò)編碼器生成。(Encoder)和解碼器(Decoder)實(shí)現(xiàn)數(shù)據(jù)生成的兩個(gè)部分。編碼器負(fù)責(zé)向潛在空間中的分布映射輸入數(shù)據(jù),解碼器負(fù)責(zé)從潛在空間中分布采樣數(shù)據(jù)并生成新數(shù)據(jù)。
三是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN, Recurrent Neural Networks):RNN是一種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),用于處理序列數(shù)據(jù)。RNN具有記憶功能,能夠捕捉到序列數(shù)據(jù)中的時(shí)序信息。RNN可用于生成文本、音樂(lè)等序列數(shù)據(jù)。
Transformer模型:基于自注意力的Transformer是一種(Self-Attention)該系統(tǒng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)在自然語(yǔ)言理解領(lǐng)域取得了顯著的成就。Transformer模型可用于生成任務(wù),如文本生成、機(jī)器翻譯等。
其它相關(guān)技術(shù):除上述技術(shù)外,還有PixelRNNNNNN等其它生成模型和技術(shù),、PixelCNN、WaveNet等。在圖像和音頻生成等領(lǐng)域,這些技術(shù)也取得了一些成果。
生成式AI技術(shù),如大語(yǔ)言模型,帶來(lái)了新的AI發(fā)展范式,其應(yīng)用價(jià)值非常廣闊。。對(duì)大眾而言,生成式AI代表著一種新的創(chuàng)造性工具,將在更大程度上釋放個(gè)人的想象力和創(chuàng)造性生產(chǎn)。此外,AIGC還將改變獲取信息的主要方式。在尋找答案、解決問(wèn)題的效率方面,ChatGPT已經(jīng)部分超越了今天的搜索引擎,ChatGPT可能會(huì)改變我們未來(lái)獲取信息、導(dǎo)出內(nèi)容的方式,AIGC有望成為數(shù)字經(jīng)濟(jì)時(shí)代驅(qū)動(dòng)需求爆發(fā)的殺手級(jí)應(yīng)用。
比爾·蓋茨將人工智能的發(fā)展與微控制器、個(gè)人計(jì)算機(jī)、因特網(wǎng)和智能手機(jī)進(jìn)行比較,認(rèn)為它將重塑所有行業(yè)。CEOSatya微軟公司 Nadella認(rèn)為,ChatGPT是知識(shí)工作者的“工業(yè)革命”,人工智能肯定會(huì)徹底改變所有類型的軟件服務(wù)。當(dāng)前,許多軟件服務(wù),如搜索、辦公、在線會(huì)議等,已經(jīng)融入了生成式AI的能力。CEOSamOPenAI公司 Altman表示,多模態(tài)AI模型有望成為繼移動(dòng)互聯(lián)網(wǎng)之后的新技術(shù)平臺(tái)。這意味著,基于預(yù)訓(xùn)練的AI模型,開(kāi)發(fā)人員可以通過(guò)模型微調(diào)快速開(kāi)發(fā)垂直領(lǐng)域的模型應(yīng)用并進(jìn)行部署和使用,人工智能革命就在這里。[2]
AIGC的應(yīng)用領(lǐng)域和案例
文本生成領(lǐng)域
自然語(yǔ)言生成是一種AIGC技術(shù),可以生成逼真的自然語(yǔ)言文本。生成AI可以為作家和內(nèi)容創(chuàng)作者寫(xiě)文章、故事、詩(shī)歌等提供新的創(chuàng)作方法。同時(shí)還可以用于智能對(duì)話系統(tǒng),提高用戶與AI的交流體驗(yàn)。
ChatGPT (全名:Chat Generative Pre-trained 由OpenAI開(kāi)發(fā)的Transformer對(duì)話生成預(yù)訓(xùn)練轉(zhuǎn)換模型是人工開(kāi)發(fā)的。 2022年11月推出智能聊天機(jī)器人程序。該程序使用基于GPT-3.5架構(gòu)的大型語(yǔ)言模型,并通過(guò)增強(qiáng)學(xué)習(xí)來(lái)練習(xí)。目前,ChatGPT仍然以文字的形式進(jìn)行交互,可以解決各種任務(wù),包括自動(dòng)文本生成、自動(dòng)問(wèn)答和自動(dòng)摘要。
Jasper已經(jīng)開(kāi)始為谷歌、臉書(shū)等知名公司提供AIGC文案業(yè)務(wù)。
圖像生成領(lǐng)域
在AIGC技術(shù)中,圖像生成是最常用的應(yīng)用之一。Stability AI發(fā)布了穩(wěn)定的擴(kuò)散(Stable Diffusion)AI繪畫(huà)的技術(shù)使用門(mén)檻通過(guò)開(kāi)源快速迭代大大降低。消費(fèi)者可以通過(guò)訂閱他們的產(chǎn)品DreamStudio來(lái)輸入文本提示來(lái)生成藝術(shù)作品。該產(chǎn)品吸引了世界50多個(gè)國(guó)家超過(guò)100萬(wàn)用戶注冊(cè)。
音頻和視頻的創(chuàng)作和生成
AIGC技術(shù)可用于語(yǔ)音合成,即生成逼真的語(yǔ)音。例如,生成模型可以通過(guò)學(xué)習(xí)人類的語(yǔ)音特征來(lái)生成逼真的語(yǔ)音,然后用于虛擬助手、在線翻譯等應(yīng)用??捎糜谏梢魳?lè)的AIGC技術(shù)。根據(jù)給定的風(fēng)格和旋律,生成式AI可以創(chuàng)作出新的音樂(lè)作品,為音樂(lè)家提供新的創(chuàng)作靈感。這一技術(shù)也能幫助音樂(lè)家更有效地探索音樂(lè)風(fēng)格與元素的結(jié)合。這類歌曲可用于音樂(lè)創(chuàng)作、廣告音樂(lè)等應(yīng)用。
電影和游戲
生成AI可以用來(lái)生成虛擬人物、情境和動(dòng)畫(huà),給電影和游戲制作帶來(lái)更多的創(chuàng)意。此外,AI還可以根據(jù)用戶的喜好和行為生成個(gè)性化的故事情節(jié)和游戲體驗(yàn)。
騰訊AI2023年3月 Lab在GDC上提出了一鍵生成3D虛擬場(chǎng)景的解決方案,可以幫助游戲開(kāi)發(fā)者以更低的成本創(chuàng)造出風(fēng)格多樣、貼近現(xiàn)實(shí)的虛擬城市,提高3D虛擬場(chǎng)景的生產(chǎn)效率。重點(diǎn)介紹了城市布局生成、建筑外觀生成、室內(nèi)投影生成三大能力。與手動(dòng)設(shè)計(jì)相比,整個(gè)路網(wǎng)生成和微調(diào)過(guò)程只需不到30分鐘,效率提高了近100倍;而且單個(gè)獨(dú)特建筑的生產(chǎn)時(shí)間減少到17.5分鐘,大大提高了場(chǎng)景設(shè)計(jì)的效率。
科學(xué)研究與創(chuàng)新
生成AI可以探索新的理論和實(shí)驗(yàn)方法,幫助科學(xué)家在化學(xué)、生物、物理等領(lǐng)域找到新的知識(shí)。此外,生成AI還可用于藥物設(shè)計(jì)、材料科學(xué)等領(lǐng)域,加快技術(shù)創(chuàng)新和發(fā)展。
6.代碼生成領(lǐng)域
經(jīng)過(guò)自然語(yǔ)言和數(shù)十億行代碼的訓(xùn)練。一些生成式AI模型精通十多種語(yǔ)言,包括Python、JavaScript、Go、Perl、PHP、Ruby等。可以根據(jù)自然語(yǔ)言的指令生成相應(yīng)的代碼。
GitHub Copilot是由GitHub和OpenAI合作產(chǎn)生的AI代碼生成工具,可以根據(jù)命名或編輯的代碼前后的文本為開(kāi)發(fā)者提供代碼建議。官方介紹說(shuō),它已經(jīng)接受了來(lái)自GitHub上公開(kāi)可用存儲(chǔ)庫(kù)的數(shù)十億行代碼的訓(xùn)練,支持大多數(shù)編程語(yǔ)言。
CODING騰訊云新一代AI代碼助手 Wise:賦予開(kāi)發(fā)者大型AI能力,增強(qiáng)開(kāi)發(fā)體驗(yàn),提高開(kāi)發(fā)效率。CODING Wise提供多種編程語(yǔ)言,主流開(kāi)發(fā)框架和常用IDE。具有代碼補(bǔ)充、生成單元測(cè)試、代碼糾錯(cuò)等功能,可以幫助開(kāi)發(fā)者加快研發(fā)過(guò)程,提高開(kāi)發(fā)質(zhì)量。CODING Wise能力涵蓋了溝通、編碼、審查等重要環(huán)節(jié),包括:溝通階段:通過(guò)對(duì)話,進(jìn)行前后推理,給出代碼回復(fù),幫助開(kāi)發(fā)者理解代碼邏輯;R&D階段:根據(jù)當(dāng)前代碼類型、代碼前后文本等信息完成代碼;注釋和單元測(cè)試代碼可以根據(jù)代碼反向生成;錯(cuò)誤排列階段:檢查錯(cuò)誤代碼,定位問(wèn)題,幫助生成建議;然后給出建議代碼,更換錯(cuò)誤的代碼塊;審查階段:幫助開(kāi)發(fā)者生成代碼并提交信息。審查者還可以生成審查建議;調(diào)整階段:可以通過(guò)自然語(yǔ)言指令快速修改和調(diào)整代碼。
理解和分析內(nèi)容
騰訊會(huì)議AI助手:信息提取、內(nèi)容分析、會(huì)議控制等各種復(fù)雜任務(wù)。只有通過(guò)簡(jiǎn)單自然的會(huì)議指令和對(duì)會(huì)議內(nèi)容的認(rèn)知,才能完成。會(huì)后可以一鍵生成智能總結(jié)摘要,也可以幫助用戶基于智能錄制能力高效復(fù)習(xí),提高用戶會(huì)議和信息流通的效率。
最近,彭博社發(fā)布了一個(gè)為金融界打造的大語(yǔ)言模型。(LLM)——BloombergGPT。其技術(shù)原理與ChatGPT相似,即采用Transformer模型和大規(guī)模預(yù)訓(xùn)練技術(shù)實(shí)現(xiàn)自然語(yǔ)言理解,擁有500億參數(shù)。BloombergGPT的預(yù)訓(xùn)練數(shù)據(jù)集主要來(lái)自彭博社的新聞和金融數(shù)據(jù),建立了3630億個(gè)標(biāo)簽數(shù)據(jù),支持金融業(yè)的各項(xiàng)任務(wù)。
BloombergGPT旨在幫助用戶更好地了解和分析財(cái)務(wù)數(shù)據(jù)和新聞。能根據(jù)用戶的輸入,生成新聞?wù)?、市?chǎng)分析、投資建議等與金融相關(guān)的自然語(yǔ)言文本。其應(yīng)用場(chǎng)景主要包括金融分析、商務(wù)咨詢、資產(chǎn)管理等領(lǐng)域。例如,在資產(chǎn)管理領(lǐng)域,它可以根據(jù)歷史數(shù)據(jù)和市場(chǎng)情況預(yù)測(cè)未來(lái)的股價(jià)和交易量,為投資經(jīng)理提供投資建議和決策支持。在金融新聞?lì)I(lǐng)域,BloombergGPT可以根據(jù)市場(chǎng)數(shù)據(jù)和事件一鍵生成新聞?wù)头治鰣?bào)告,為讀者提供及時(shí)準(zhǔn)確的金融信息。
8.AI智能體(AI Agent)
AI智能體(AI Agent)它被稱為OpenAI的下一個(gè)方向。自今年3月AutoGPT推出以來(lái),Generative Agent、GPT-Engineer、BabyAGI項(xiàng)目的爆發(fā)將LLM的敘述帶入了一個(gè)新的階段,從“超級(jí)大腦”到“全能助手”。
2023年4月,Github上發(fā)布了一個(gè)名為AutoGPT的開(kāi)源項(xiàng)目,截至2023年4月16日,該項(xiàng)目已獲得70K。 星。AutoGPT是一個(gè)開(kāi)源應(yīng)用程序,由GPT-4驅(qū)動(dòng),可以獨(dú)立實(shí)現(xiàn)用戶設(shè)定的任何目標(biāo)。AutoGPT在客戶提出需求或任務(wù)時(shí),會(huì)獨(dú)立分析問(wèn)題,給出具體的執(zhí)行計(jì)劃并開(kāi)始執(zhí)行,直到客戶提出的要求得到滿足。
Auto-GPT的出現(xiàn)意味著AGI正在逐步向更加自主化和智能化方向發(fā)展。第一,它可以使人工智能技術(shù)更加普及和方便。目前Auto-GPT能夠獨(dú)立分析和執(zhí)行任務(wù),大大降低了應(yīng)用的門(mén)檻和費(fèi)用,使更多的人能夠輕松地使用人工智能技術(shù)來(lái)解決問(wèn)題。其次,Auto-GPT可以提高人工智能技術(shù)的效率。傳統(tǒng)的人工智能模型需要從頭到尾完成整個(gè)任務(wù),這樣會(huì)浪費(fèi)大量的時(shí)間和計(jì)算資源,而且容易出錯(cuò)。AutoGPT可以獨(dú)立分析任務(wù),并提出具體的執(zhí)行計(jì)劃,這樣可以大大縮短執(zhí)行時(shí)間,降低錯(cuò)誤率。[3]
雖然Auto-GPT還處于非常早期的實(shí)驗(yàn)階段,但它開(kāi)辟了一種全新的AI交互技術(shù),即機(jī)器主動(dòng)要求任務(wù)和計(jì)劃,人類只需要給出任務(wù)目標(biāo)。這種交互技術(shù)不僅提高了AI智能體的自主性和靈活性,而且擴(kuò)展了人與AI之間的交互技術(shù),打破了人類對(duì)人工智能“控制”的想象,促使人工智能技術(shù)從“工具”走向人類的“伙伴”。
除單獨(dú)的AI外 除了Agent之外,未來(lái)還可能出現(xiàn)由多個(gè)AI智能體組成的“虛擬智能社會(huì)”。GenerativeAgents—一篇名為斯坦福大學(xué)和谷歌聯(lián)合發(fā)布的文章《GenerativeAgents:InterativeSimulacra of Human Behavior》在論文中,研究人員成功地建立了一個(gè)“虛擬小鎮(zhèn)”,其中25個(gè)智能體存活在小鎮(zhèn)上。在AIGC的幫助下,NPC有了可靠的人類行為,對(duì)周圍環(huán)境的變化做出了適度的反應(yīng),促使賽博空間可以通過(guò)實(shí)際的社會(huì)現(xiàn)象來(lái)增加。
海外商業(yè)咨詢機(jī)構(gòu)預(yù)測(cè),到2030年,AIGC和生成AI的市場(chǎng)規(guī)模將達(dá)到1100億美元。就像“互聯(lián)網(wǎng) ”一樣,“AIGC “有望滲透到各行各業(yè),在教學(xué)、醫(yī)療、金融、政務(wù)、制造、機(jī)器人、數(shù)字人、元宇宙、廣告推廣、電子商務(wù)、市場(chǎng)和戰(zhàn)略咨詢等諸多領(lǐng)域帶來(lái)新的應(yīng)用模式,深刻賦能各行各業(yè),幫助高質(zhì)量發(fā)展。
AIGC產(chǎn)業(yè)應(yīng)用中的挑戰(zhàn)和問(wèn)題
可解釋性和可靠性
生成人工智能可解釋性問(wèn)題是指生成人工智能(Generative Artificial Intelligence)難以解釋或理解形成的結(jié)果。生成人工智能是一種基于深度學(xué)習(xí)的人工智能技術(shù),它通過(guò)學(xué)習(xí)大量的數(shù)據(jù)來(lái)生成新的數(shù)據(jù)或圖像。但是,生成式人工智能所產(chǎn)生的結(jié)果一般是無(wú)法理解和解釋的,因?yàn)樗膬?nèi)部操作過(guò)程非常復(fù)雜,而且難以直觀地描述。
這一可解釋性問(wèn)題對(duì)醫(yī)療診斷、金融風(fēng)險(xiǎn)控制、自動(dòng)駕駛等多個(gè)應(yīng)用領(lǐng)域十分重要。在這些領(lǐng)域中,每個(gè)人都需要了解生成型人工智能的內(nèi)部運(yùn)行過(guò)程,以便更好地了解其結(jié)果,并能對(duì)其進(jìn)行調(diào)整和優(yōu)化。
目前,人工智能研究的一個(gè)重要方向是處理生成型人工智能的可解釋性問(wèn)題。研究人員正在探索各種方法,使生成型人工智能的結(jié)果更加可解釋和可理解。這些方法包括可視化技術(shù)、可解釋模型、對(duì)抗樣本等。
2.AI模型的價(jià)值對(duì)齊問(wèn)題
所謂的人工智能價(jià)值對(duì)齊(AI Alignment),使人工智能系統(tǒng)的行為符合人類的目標(biāo)、偏好或倫理原則。AI安全研究的核心問(wèn)題是價(jià)值對(duì)齊。理論上,如果一個(gè)強(qiáng)大的AI系統(tǒng)所努力的目標(biāo)與人類的真實(shí)意圖和價(jià)值不一致,就有可能給人類帶來(lái)毀滅性的后果。目前,大語(yǔ)言模型的價(jià)值對(duì)齊具體表現(xiàn)為如何讓人工智能在模型上理解人類的價(jià)值和倫理原則,盡可能避免模型的有害導(dǎo)出,從而打造更有用、更符合人類價(jià)值觀的AI模型。RLHF是一種有效的方法,通過(guò)少量的數(shù)據(jù)可以達(dá)到較好的效果??傊?,RLHF要求人類專家根據(jù)人類提供的反饋,對(duì)模型導(dǎo)出內(nèi)容的適當(dāng)性進(jìn)行評(píng)估,并對(duì)模型進(jìn)行優(yōu)化。它的目標(biāo)是降低模型在未來(lái)生產(chǎn)有害內(nèi)容的可能性。實(shí)際上,RLHF算法不僅是確保AI模型具有正確價(jià)值觀的關(guān)鍵,而且對(duì)于生成式AI領(lǐng)域的長(zhǎng)期健康可持續(xù)發(fā)展也非常重要。[4]
塑造一個(gè)負(fù)責(zé)任的AI創(chuàng)新生態(tài)
生成式AI的進(jìn)展,如大語(yǔ)言模型,不僅讓人們看到了AGI的曙光,也帶來(lái)了更加復(fù)雜和難以控制的風(fēng)險(xiǎn),包括對(duì)人類未來(lái)生存的潛在風(fēng)險(xiǎn)。人工智能時(shí)代需要成為一個(gè)負(fù)責(zé)任的創(chuàng)新時(shí)代,而不是另一個(gè)“快速行動(dòng),打破陳規(guī)”的時(shí)代。每個(gè)人都需要建立一個(gè)合理謹(jǐn)慎的人工智能倫理和治理框架,建立一個(gè)負(fù)責(zé)任的人工智能生態(tài),創(chuàng)造一個(gè)人機(jī)和諧共生的未來(lái)。生成AI領(lǐng)域的創(chuàng)新主體需要積極探索技術(shù)和管理的安全措施,為生成AI的健康發(fā)展和安全可控應(yīng)用筑起護(hù)欄。
在科技向善的理念下,人工智能時(shí)代不應(yīng)該成為另一個(gè)“快速行動(dòng),打破規(guī)則”的時(shí)代(即先快速制造產(chǎn)品,再通過(guò)修復(fù)和補(bǔ)救解決社會(huì)問(wèn)題)。相反,它應(yīng)該成為一個(gè)負(fù)責(zé)任和創(chuàng)新的時(shí)代。通過(guò)建立合理謹(jǐn)慎的人工智能倫理和治理框架,創(chuàng)造負(fù)責(zé)任的人工智能生態(tài),創(chuàng)造人機(jī)和諧共生的未來(lái)。[5]
未來(lái)AIGC在工業(yè)應(yīng)用中的趨勢(shì)
多模式帶來(lái)了藍(lán)海海創(chuàng)新應(yīng)用
多模態(tài)AI是指人工智能,如文本、圖像、音頻、視頻等。,可以處理和理解各種類型的信息。這種AI不僅可以處理單一數(shù)據(jù)類型的任務(wù),還可以連接和整合不同的數(shù)據(jù)類型,從而實(shí)現(xiàn)對(duì)多模式的全面全面的理解。AI可以相關(guān)分析不同類型的信息,支持解決復(fù)雜問(wèn)題。
在多模態(tài)技術(shù)發(fā)展初期,圖像識(shí)別與自然語(yǔ)言處理技術(shù)的融合等不同模態(tài)的AI開(kāi)始集成。除了ImageBind打通六種模式外,大部分還在探索文字和圖像的結(jié)合,但進(jìn)展很快。UniDiffuser:除了單向圖形圖形外,還可以實(shí)現(xiàn)圖形提問(wèn)、圖形聯(lián)合生產(chǎn)、無(wú)條件圖形生成等多種功能。
許多模態(tài)AI案例,如DALLLLLL,都開(kāi)發(fā)了OpenAI。-E、CLIP等,可以識(shí)別圖像中的目標(biāo),同時(shí)生成與圖像相關(guān)的描述性文本,或者通過(guò)文本指導(dǎo)生成相關(guān)物體的新圖像。
隨著多模態(tài)技術(shù)的發(fā)展,多模態(tài)AI可以在理解和處理不同類型數(shù)據(jù)時(shí)實(shí)現(xiàn)更高水平的組合。算法和模型可以連接不同的數(shù)據(jù)類型,提取不同模式的共享信息。這使得AI能夠深刻理解和解決復(fù)雜的問(wèn)題。未來(lái),多模態(tài)技術(shù)的發(fā)展將帶來(lái)創(chuàng)新應(yīng)用的藍(lán)海。[6]
生成式AI帶來(lái)更符合人際交互技術(shù)的技術(shù)
從用鍵盤(pán)-鼠標(biāo)與計(jì)算機(jī)互動(dòng),到用手指滑動(dòng)屏幕與手機(jī)互動(dòng),再到人們用喚醒詞與智能音響互動(dòng),人機(jī)互動(dòng)不斷向更符合人們習(xí)慣的互動(dòng)技術(shù)演變,從識(shí)別機(jī)器指令到識(shí)別人的動(dòng)作和聲音。隨著生成式AI的發(fā)展,人類第一次有機(jī)會(huì)用自然語(yǔ)言與機(jī)器交談。機(jī)器也有很強(qiáng)的能力通過(guò)大模型理解人類語(yǔ)言,有望帶來(lái)全新的互動(dòng)變革。就像之前的互動(dòng)變化帶來(lái)的從終端到連接再到各種應(yīng)用的顛覆性變化一樣,生成式AI也必然會(huì)帶來(lái)產(chǎn)業(yè)鏈、價(jià)值鏈和生態(tài)的重塑。
生成式AI的技術(shù)突破,大大提高了對(duì)模型的理解能力。大型模型能更好地理解人類表達(dá)的意義,并產(chǎn)生更符合人類價(jià)值觀的答案。它的技術(shù)成熟度已能在許多場(chǎng)景中得到應(yīng)用,甚至實(shí)用。隨著科技公司對(duì)齊工作的不斷進(jìn)步,大模型的“幻覺(jué)”不斷減少,這使得人類第一次完全有可能通過(guò)自然語(yǔ)言對(duì)話與機(jī)器進(jìn)行交流。它也是人們挖掘機(jī)器智能最簡(jiǎn)單、最直接、最有效的交互技術(shù)。
在這種背景下,所有的APP都可以用生成AI重做,并且可能會(huì)產(chǎn)生原生AI。 APP。一方面,在后端不變的前提下,目前所有軟件的前端互動(dòng)都可以直接改變?yōu)樽匀徽Z(yǔ)言對(duì)話的方式,讓更多的應(yīng)用具備智能對(duì)話的能力,給用戶帶來(lái)全新的感受?,F(xiàn)在很多應(yīng)用軟件和硬件已經(jīng)開(kāi)始向這個(gè)方向升級(jí)。另外一方面,未來(lái)更具市場(chǎng)創(chuàng)造力的,是原生AI。 APP,比如未來(lái)很有可能會(huì)有一個(gè)無(wú)所不能的個(gè)人助理。他可以回答人們的各種問(wèn)題,幫助人們提出建議,甚至做更多的工作,比如會(huì)議預(yù)訂、文章寫(xiě)作、文藝創(chuàng)作等等?!皺C(jī)器生成 在可預(yù)見(jiàn)的未來(lái),人腦選擇將成為人機(jī)合作的重要途徑。[7]
結(jié)論
綜上所述,生成型人工智能在探索和演變過(guò)程中取得了顯著成效,為人們社會(huì)的進(jìn)步和發(fā)展提供了強(qiáng)大的技術(shù)支持。從深度學(xué)習(xí)、自然語(yǔ)言理解等技術(shù)的發(fā)展,到生成型人工智能在各個(gè)行業(yè)的應(yīng)用,都顯示出其強(qiáng)大的潛力和價(jià)值。然而,隨著技術(shù)的不斷創(chuàng)新和突破,生成型人工智能在數(shù)據(jù)安全、隱私保護(hù)、倫理等方面存在一些挑戰(zhàn)。在應(yīng)用過(guò)程中也暴露出來(lái)。所以,未來(lái)的研究應(yīng)該注意如何在保證技術(shù)創(chuàng)新的同時(shí),解決這些潛在的問(wèn)題,從而實(shí)現(xiàn)人工智能的可持續(xù)發(fā)展。此外,為了實(shí)現(xiàn)人類社會(huì)的共同繁榮和進(jìn)步,各國(guó)政府、公司和研究機(jī)構(gòu)應(yīng)加強(qiáng)合作,共同推進(jìn)生成式人工智能的研究和應(yīng)用。
徐思彥 騰訊研究院高級(jí)研究員
本文來(lái)自微信微信官方賬號(hào)“騰訊研究院”(ID:cyberlawrc),作者:徐思彥,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com