另外一張百億牌桌要翻?
原創(chuàng) 陳廣晶 虎嗅APP
出品 | 虎嗅醫(yī)療組
作者 | 陳廣晶
編輯 | 王一鵬
頭圖 | 視覺中國
大模型再次攻擊科學(xué)界的降維?
法國科學(xué)家埃馬紐埃爾·卡彭蒂·2011年(Emmanuelle Charpentier)詹妮弗·杜德納·美國科學(xué)家(Jennifer Doudna)首次合成CRISPR/Cas9(核酸酶蛋白與RNA的結(jié)合),并證明細(xì)菌確實(shí)可以用它來切斷病毒DNA,以反擊入侵。
但是,杜德納團(tuán)隊(duì)并沒有第一時(shí)間證明這個(gè)工具可以用于動(dòng)物甚至人類,而是被中國科學(xué)家張鋒截了胡。
CRISPR美國麻省理工學(xué)院-哈佛博德研究所的張鋒團(tuán)隊(duì)在發(fā)表Cas9相關(guān)論文后,首次對(duì)動(dòng)物進(jìn)行實(shí)驗(yàn)。2013年,他們成功地驗(yàn)證了CRISPR/Cas9,在RNA的指導(dǎo)下,他們能夠準(zhǔn)確地將內(nèi)源基因組分切割到人類和小鼠細(xì)胞中,并獲得相應(yīng)的專利。
2022年,張鋒及其所在機(jī)構(gòu)獲得了CRISPR/Cas9用于所有真核生物的專利,包括動(dòng)植物、人類等。換句話說,所有相關(guān)的商業(yè)應(yīng)用都必須得到授權(quán)。因此,張鋒僅憑專利授權(quán)就獲得了巨大的收入。他創(chuàng)辦了八家創(chuàng)業(yè)公司。換句話說,從2016年開始,幾乎每年都會(huì)有一家以他的名義新的生物技術(shù)公司。在這些情況下,每年都有“躺”賺上億美元的潛力。
這個(gè)故事本來應(yīng)該停留在“專利戰(zhàn)”的故事范圍內(nèi),但是4月23日,一個(gè)意想不到的變量卷了進(jìn)來:AI技術(shù)公司Profluent發(fā)布了世界上第一個(gè)AI模型設(shè)計(jì)基因編輯器OpenCRISPR-1,并且開源,在符合倫理?xiàng)l件的情況下,無論是科學(xué)研究還是商業(yè)行為都可以免費(fèi)使用。更重要的是,大型模型已經(jīng)擴(kuò)展了4.8倍的Cas蛋白質(zhì)空間,可以作為基因編輯器存在于自然中。OpenCRISPR-一是以這種蛋白質(zhì)生成基因編輯器的代表,具有很高的功能性和特異性。
根據(jù)AI生成基因編輯器發(fā)布的Profluent公告,這次他們還同時(shí)推出了OpenCRISPRTM計(jì)劃,希望通過鼓勵(lì)更多人使用和檢測OpenCRISPR-1系統(tǒng),不斷迭代和推進(jìn)相關(guān)計(jì)劃。
在張鋒和杜德納專利戰(zhàn)的背后,還有一個(gè)數(shù)百億的其他市場。Profluent 這次公司的發(fā)布是一封“戰(zhàn)書”,不僅給了張鋒隊(duì)和杜德納隊(duì),也給了所有正在努力開發(fā)基因編輯器的科學(xué)家。
開源基因編輯器OpenCRISPR-1的框架圖是世界上第一個(gè)人工智能建立的。來自:Profluent公司網(wǎng)站
最強(qiáng)挑戰(zhàn)者來了
「工欲善其事,工欲善其事」,有些跑道如果沒有出現(xiàn)可用的工具,根本就不存在,基因編輯就是其中之一。
簡單地說,基因編輯就是通過刪除、插入或替換某個(gè)基因序列來促進(jìn)基因組的特定變化。
比如:改變大米白葉枯病感病基因的啟動(dòng)子,提高大米的抗病能力;比如人為敲掉老鼠的特定基因,使其含有某種疾病,從而初步驗(yàn)證藥物的安全性和有效性;比如修改錯(cuò)誤基因,治療罕見病。
可以說,在碳基生命領(lǐng)域,基因編輯也是一項(xiàng)令人震驚的技術(shù)成果,不僅創(chuàng)造了許多諾貝爾獎(jiǎng)獲得者,開拓了數(shù)百億美元的市場,也為解碼碳基生命提供了鑰匙。
而且這種技術(shù)可以在近十年來如此迅速地實(shí)現(xiàn)和發(fā)展,簡單的基因編輯器,即CRISPR/Cas系統(tǒng)的成功開發(fā)是不可或缺的。
基因編輯器的發(fā)現(xiàn)也經(jīng)歷了一個(gè)相對(duì)曲折的過程。早在1987年,一些研究人員就發(fā)現(xiàn)了CRISPR,但直到2009年,CRISPR能夠準(zhǔn)確切割DNA的事實(shí)才逐漸變得清晰。
目前,主流基因編輯器CRISPR/Cas系統(tǒng)是一個(gè)由單個(gè)Cas蛋白(CRISPR相關(guān)蛋白,是核酸酶)人工改造而成的生物功能系統(tǒng),主要包括Cas蛋白結(jié)構(gòu)域和指導(dǎo)RNA-Cas蛋白相當(dāng)于“剪刀”對(duì)DNA的切割目標(biāo)負(fù)責(zé),指導(dǎo)RNA是負(fù)責(zé)精確定位的“導(dǎo)航”。
CRISPRCas9包括Cas9蛋白質(zhì)(核酸酶)和RNA。來源:Nature
與前兩代基因編輯器(ZFNs)相比TALENs),CRISPR/Cas系統(tǒng)構(gòu)建更簡單、更經(jīng)濟(jì)、更高效,不僅廣泛應(yīng)用于農(nóng)業(yè),而且在疾病治療等領(lǐng)域也迅速推廣。
然而,仍有業(yè)內(nèi)人士認(rèn)為,基因編輯領(lǐng)域的快速發(fā)展確實(shí)需要大量的備份工具。在實(shí)際應(yīng)用中,主流CRISPR/Cas系統(tǒng)只能敲掉基因片段,不能給后來者增加基因片段等缺點(diǎn)。
根據(jù)Statista的數(shù)據(jù),截至2019年2月,僅美國就有5336項(xiàng)CRISPR專利申請(qǐng)。
而且在眾多挑戰(zhàn)者中,大模型可以算是來勢最強(qiáng)的。
根據(jù)Profluent團(tuán)隊(duì)在預(yù)印本網(wǎng)站上發(fā)布的論文,人工智能可以繞過進(jìn)化限制,生成具有最佳屬性的編輯器。該團(tuán)隊(duì)生成了400萬個(gè)蛋白質(zhì)序列,其中一部分是由模型直接生成的,另一部分是由天然蛋白質(zhì)“改造”的。
這種蛋白質(zhì)不同于天然蛋白質(zhì)——與任何天然蛋白質(zhì)相比,它們都有數(shù)百個(gè)突變。盡管只有27.6%通過了選擇,但Cas蛋白質(zhì)家族的規(guī)模仍然得到有效擴(kuò)大:整體擴(kuò)大了4.8倍,其中cas13家族的天然蛋白質(zhì)較少,擴(kuò)大了8.4倍。此外,上述結(jié)果,僅在16個(gè)GPU上,需要3天時(shí)間才能得到。
對(duì)于張鋒團(tuán)隊(duì)乃至世界上所有參與挑戰(zhàn)的科學(xué)家團(tuán)隊(duì)來說,這種效率是壓倒性的。但效率只是一個(gè)方面。從效果來看,大模型沒有顯著優(yōu)勢;從控制層面來說,大模型很難進(jìn)入市場。

雖然卡彭蒂耶和杜德納在專利競賽中失利,但他們?cè)?020年獲得了諾貝爾化學(xué)獎(jiǎng),因?yàn)樗麄冊(cè)诨蚓庉嫹矫娴姆瞰I(xiàn)。來自:視覺中國
目前攪局者影響不大
《生物世界》主編王聰告訴虎嗅,首先,大型基因編輯器的生成效果很難比自然更好?!耙簿褪撬^的垂下果實(shí)已經(jīng)被采摘了”;其次,基因編輯器只是一個(gè)工具,后續(xù)監(jiān)管的考驗(yàn)還是很大的。無論哪種情況,如果不能比現(xiàn)有產(chǎn)品更好更領(lǐng)先,監(jiān)管機(jī)構(gòu)都不太可能允許。
事實(shí)上,擁有核心專利的CRISPR/Cas9,張鋒團(tuán)隊(duì)已成為最好的編輯器?!盋RISPR基因編輯/Cas9的效率接近1000%。在接受《中國新聞周刊》采訪時(shí),美國國家科學(xué)院和工程院教授、哈佛醫(yī)學(xué)院遺傳學(xué)系教授喬治·丘奇指出。他曾經(jīng)是張鋒的博士后導(dǎo)師。
而且在十幾年發(fā)展的基礎(chǔ)上,基因治療已經(jīng)從體外編輯后將修改后的基因片段輸入體內(nèi)治療(一般基因治療是一種“替代”治療),發(fā)展到第二代基因治療疾病(基因編輯治療)的直接編輯。
2023年底,全球已獲準(zhǔn)基因編輯治療。——CRISPR Casgevy,一家治療公司/福泰制藥,是一種用于治療罕見疾病的藥物。與此同時(shí),世界上還有十多種類似的產(chǎn)品。
這類產(chǎn)品的原理是利用病毒載體等輸送系統(tǒng)將CRISPR/cas9“輸送”到人體內(nèi),直接編輯錯(cuò)誤的基因來治療疾病。
這種對(duì)基因編輯器安全性的要求無疑更高,在一定程度上也提高了基因編輯器進(jìn)入的門檻。CRISPR/cas系統(tǒng)問世10年后,其安全性得到了監(jiān)管部門的認(rèn)可。新編輯器需要多少年?王聰說:“即使是同一個(gè)編輯器,也需要重新進(jìn)行臨床試驗(yàn)來治療不同的疾病。
這意味著即使一個(gè)大模型可以在一分鐘內(nèi)生成數(shù)百萬個(gè)基因編輯器,其中確實(shí)有更好的。如果你想挑戰(zhàn)現(xiàn)有的高效基因編輯器,還需要時(shí)間。
然而,AI對(duì)基因編輯器的開始仍然是一個(gè)值得關(guān)注的進(jìn)展。作為生命科學(xué)領(lǐng)域的大模型,這一事件背后的行業(yè)趨勢不容忽視?!斑@是一個(gè)開始?!蓖趼斚蚧⑿嶂赋?,“大模型 “生物技術(shù)”已成為熱門賽道。
客觀來說,CRISPR/Cas系統(tǒng)具有明顯的優(yōu)點(diǎn),應(yīng)用廣泛,但仍有待改進(jìn)。
比如:只能做減法,不能做加法;如果目標(biāo)基因序列前面沒有“”PAM“序列(可以理解為提醒基因“剪刀”可以暗語),不能切割;因?yàn)镃RISPR/Cas系統(tǒng)來自古代細(xì)菌或細(xì)菌,它們與哺乳動(dòng)物的DNA修復(fù)系統(tǒng)沒有那么好的配合,很容易在人類細(xì)胞中脫靶;等等。
而且大模型學(xué)習(xí)速度非??欤偌由先蚩茖W(xué)家、商業(yè)公司的加入,也確實(shí)有機(jī)會(huì)改變行業(yè)。
可以看出,當(dāng)時(shí)張鋒的團(tuán)隊(duì)很早就把CRISPR的專利完全公開了非商業(yè)用途,這也穩(wěn)定了他們?cè)诳蒲蓄I(lǐng)域的地位——全球科學(xué)界根據(jù)《不可思議的科學(xué)史》一書接受了張鋒團(tuán)隊(duì)的制度,直到杜德納團(tuán)隊(duì)長期宣布自己的專利。這也為他們?cè)谖磥矸€(wěn)定市場的“霸主”地位奠定了基礎(chǔ)。
如今,OpenCRISPR-1R&D人員“以自己的方式治愈自己”,開源更徹底,不僅免費(fèi)開放科研,還免費(fèi)開放商業(yè)行為。對(duì)更多好的基因編輯器的加速發(fā)現(xiàn)和迭代大有裨益。
蛋白質(zhì)和編輯基因是通過可以快速迭代的大模型產(chǎn)生的,這種將硅基生命和碳基生命緊密聯(lián)系起來的概率,激勵(lì)了科學(xué)界、投資界和初創(chuàng)企業(yè)。
Davididid是美國華盛頓大學(xué)生物化學(xué)系教授 Baker,在4月23日,他開始了一家新的創(chuàng)業(yè)公司Xairairaira,這是蛋白質(zhì)結(jié)構(gòu)領(lǐng)域的大師。 Therapeutics,獲得10億美元的“種子輪”融資,F(xiàn)oresite capital、F-Prime(富達(dá)投資旗下)、紅杉資本等都屬于投資者。這種可能性是今年生物技術(shù)領(lǐng)域最高的融資。
這個(gè)企業(yè)就是要靠Davidid Baker團(tuán)隊(duì)推出了從零開始設(shè)計(jì)和生成抗體藥物的大型模型?;驕y序巨頭Illumina和生物技術(shù)創(chuàng)業(yè)公司Interliner也被引入到新的團(tuán)隊(duì)中。 Therapeutics團(tuán)隊(duì)和技術(shù)涵蓋了基因?qū)W和蛋白質(zhì)組學(xué)。不僅要開發(fā)新的治療方法,還要解鎖生物學(xué)的奧秘,為未來更多新藥的發(fā)現(xiàn)提供指導(dǎo)。
從這個(gè)角度來看,雖然目前大模型在蛋白質(zhì)生成和基因編輯領(lǐng)域的價(jià)值有限,但AI全面進(jìn)入醫(yī)療制藥行業(yè)的趨勢已經(jīng)不可阻擋。
原題:“又一張百億牌桌要翻?”
閱讀原文
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com