號稱“全能醫(yī)療AI”, GMAI有多厲害?
肉眼可見地,人工智能領(lǐng)域正在以螺旋式上升的態(tài)勢飛速發(fā)展。
其中,基于根基模型(Foundation Models)的AI應(yīng)用程序數(shù)量也在迅猛增長。根基模型之所以叫這個名字,是因?yàn)樗鼮锳I系統(tǒng)提供了一個新的范式,開發(fā)人員可以在它的基礎(chǔ)上構(gòu)建新的專業(yè)應(yīng)用模型或生成多個應(yīng)用程序。
像ChatGPT這樣的生成式AI就是由根基模型提供支持的。顯然,這類大型AI已經(jīng)顯現(xiàn)出復(fù)雜推理、知識推理和超出分布穩(wěn)健性的能力,能夠完成用戶提出的各種任務(wù)。
然而,一些小規(guī)模、專業(yè)化的模型卻不具備這些能力。由于難以獲取大型、多樣化的醫(yī)療數(shù)據(jù)集,以及醫(yī)療領(lǐng)域具有復(fù)雜性的特征,快速發(fā)展的根基模型并未廣泛滲透到醫(yī)療人工智能行業(yè)之中。當(dāng)前的醫(yī)學(xué)人工智能模型仍大多采用特定任務(wù)的方法。例如,一個胸部X光模型可以在一個數(shù)據(jù)集上進(jìn)行訓(xùn)練,通過大量的注釋來分析每個明確標(biāo)記為肺炎陽性或陰性的圖像。這也就意味著,這個模型只能檢測肺炎,無法適配到全面的放射學(xué)報(bào)告診斷中。
這種基于特定任務(wù)的方法所訓(xùn)練出的模型不太靈活,僅限于執(zhí)行由訓(xùn)練數(shù)據(jù)集及其標(biāo)簽預(yù)定義的任務(wù)。這樣的模型如果在另一個數(shù)據(jù)集上進(jìn)行再訓(xùn)練,通常就不能適應(yīng)其他任務(wù)(甚至無法完成同一任務(wù)的不同數(shù)據(jù)分布)。在獲得美國食品藥品監(jiān)督管理局(FDA)批準(zhǔn)的500多種臨床藥物人工智能模型中,大多數(shù)的模型只被批準(zhǔn)用于1到2個狹窄的任務(wù)中。然而,以ChatGPT為代表的大模型的日益成熟,讓醫(yī)療AI的研究者看到了打造通才型(全能型)醫(yī)療AI的希望。
4月12日,Nature發(fā)表了一篇題為《通用醫(yī)學(xué)人工智能的基礎(chǔ)模型 》(Foundation models for generalist medical artificial intelligence)的文章,作者來自斯坦福大學(xué)、哈佛大學(xué)、多倫多大學(xué)和耶魯大學(xué)醫(yī)學(xué)院。這篇文章為醫(yī)學(xué)人工智能提供了一種新的范式,稱為通用醫(yī)療人工智能(generalist medical AI, GMAI)。
GMAI模型可以使用少量數(shù)據(jù)或沒有指定標(biāo)記的數(shù)據(jù)來執(zhí)行不同的任務(wù)。通過在大型、多樣化的數(shù)據(jù)集上進(jìn)行自我監(jiān)督,GMAI將靈活地解釋不同的醫(yī)療模式組合,包括來自影像、電子健康記錄、實(shí)驗(yàn)結(jié)果、基因組學(xué)、圖表或醫(yī)療文本等多種形式的數(shù)據(jù)。在輸出方面,模型可以通過其先進(jìn)的醫(yī)學(xué)推理能力呈現(xiàn)出易于理解的結(jié)果,如自由文本解釋、口頭建議或在圖像上加以注釋。
從上圖不難看出,GMAI模型有望在多種醫(yī)療場景中解決多樣化和具有挑戰(zhàn)性的任務(wù),它為用戶提供了通過自定義查詢從而與模型交互的能力,這可以使包括醫(yī)生、護(hù)理人員、檢驗(yàn)人員、患者在內(nèi)的不同受眾都能理解人工智能給出的解決方案。使用者可以不斷地給GMAI指定新任務(wù)、解決新問題,而不再需要重新給出訓(xùn)練模型讓AI從零開始學(xué)習(xí)訓(xùn)練后再投入使用,這大大節(jié)省了機(jī)器訓(xùn)練的時(shí)間和成本。此外,GMAI可以通過其接受的醫(yī)療領(lǐng)域的先驗(yàn)知識來解決更多問題,基于最新的檢索方法,在現(xiàn)有的數(shù)據(jù)庫中檢索出文章、圖像或臨床案例等它所需要的知識。
研究者給出了多種可以在臨床上使用GMAI的潛在方案。例如,在放射科功能報(bào)告中提示放射科醫(yī)生,顯示之前圖像中沒有出現(xiàn)的新的多發(fā)性硬化癥病灶。參與團(tuán)隊(duì)的外科手術(shù)(如內(nèi)窺鏡手術(shù))過程,將整個過程可視化,或提供口頭信息,如在跳過手術(shù)步驟時(shí)發(fā)出警報(bào),或在醫(yī)生遇到罕見的解剖現(xiàn)象時(shí)閱讀相關(guān)文獻(xiàn),給出手術(shù)建議。
GMAI所面臨的機(jī)遇與挑戰(zhàn)
作為一個基于AI的聊天界面,GMAI會利用人類的反饋來強(qiáng)化學(xué)習(xí)和改進(jìn)模型,以此來適應(yīng)下游程序。這樣的學(xué)習(xí)能力是GMAI模型自然生成的,但這樣的靈活性可能也是一把雙刃劍:在基礎(chǔ)模型中存在的任何故障都可能會導(dǎo)致其所有下游應(yīng)用程序受到影響。
如前所述,當(dāng)前的醫(yī)療AI模型大多是為特定任務(wù)而設(shè)計(jì)的,因此對專業(yè)的模型來說,只需通過一兩個適用的數(shù)據(jù)集即可完成驗(yàn)證,但對于通才型選手GMAI來說,由于其前所未有的通用性,將非常難以被驗(yàn)證,加上GMAI可能會面對它們從未見過的任務(wù),預(yù)測它們是成功還是失敗,將是一項(xiàng)非常有挑戰(zhàn)性的工作,因?yàn)榕R床醫(yī)生可能無法處理比它更復(fù)雜的信息,自然就更難判斷它的決策正確與否。由此,GMAI這種廣泛的應(yīng)用能力或許需要相關(guān)機(jī)構(gòu)和政府加強(qiáng)監(jiān)管,重塑新的責(zé)任制度。
結(jié)語
GMAI的出現(xiàn)讓醫(yī)療行業(yè)的研究人員看到,AI也具有巨大的潛力以改變整個醫(yī)療健康體系。作為一種高級的根基模型,GMAI將可互換地解析多種數(shù)據(jù)模式,動態(tài)地學(xué)習(xí)新任務(wù),并利用醫(yī)學(xué)領(lǐng)域知識,在幾乎無限范圍的醫(yī)療任務(wù)中提供決策。它的靈活性允許其在新的環(huán)境中保持相互關(guān)聯(lián),并與新興的疾病和技術(shù)保持同步,而不需要不斷地從頭進(jìn)行再培訓(xùn)。
盡管頗具前景,但它仍然面臨著獨(dú)特的挑戰(zhàn)。它們的多功能性使之難以被全面驗(yàn)證,它們的大小可能會增加計(jì)算成本。畢竟GMAI的訓(xùn)練數(shù)據(jù)集不僅要很大,而且要多樣化,并需要充分考慮醫(yī)療數(shù)據(jù)的隱私保護(hù)問題。但無論如何,GMAI為醫(yī)療AI行業(yè)帶來了前所未有的可能性,我們期待它能在健康醫(yī)療管理體系中發(fā)揮重要作用,造福人類健康。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





