[新聞] 所有生命分子皆可AI預測!AlphaFold3來了,全球科學家免費使用已刪文
所有生命分子皆可AI預測! AlphaFold3來了,全球科學家免費使用
https://www.qbitai.com/2024/05/140560.html
夢晨明敏
用上擴散模型,預測每個原子的3D座標
AlphaFold 3再登Nature!
這次重磅升級,不再僅限於蛋白質結構預測——可以以前所未有的精度預測所有生命分子
的結構和相互作用。
只有了解它們如何在數百萬種組合中相互作用,我們才能開始真正理解生命的過程。
這次的最大創新之一,是用上了AI繪畫上常見的去噪擴散模型,直接產生每個原子的3D座
標。
現在,AlphaFold 3對普通感冒病毒Spike蛋白(藍色)的結構預測,灰色部分為預測結果
。這能讓人類更進一步了解冠狀病毒。
https://tinyurl.com/k5uw6bvk
對蛋白質和DNA結合的分子複合物進行預測,其預測結果與真實結構幾乎一致。
在不輸入任何結構資訊的情況下,AlphaFold3預測準確度比現有方法提高了50%,對於部
分交互作用類別甚至提高了1倍。
這使得AlphaFold 3成為首個超越基於真實生物分子結構預測工具的AI系統。
而且全球科學家透過AlphaFold伺服器即可免費存取使用AlphaFold 3進行非商業研究(開
放大部分功能)。
DeepMind聯創兼CEO哈撒比斯在發表會上非常肯定地表示,AlphaFold 3是人類了解生物學
動態系統歷史性的第一步。
網友都紛紛感慨:這就是AI的用處所在啊。
用擴散網絡產生預測結果
事實上,在AlphaFold 3之前也進行過一系列小規模更新,重點提高了對蛋白質複合體的
預測精度。
所以總結下來:
AlphaFold,開創了蛋白質結構預測的新時代
AlphaFold 2,大幅提高了預測精度
AlphaFold-Multimer,將預測範圍擴展到具有多個蛋白質鏈的複合物
AlphaFold 2.3,它提高了性能並將覆蓋範圍擴大到更大的複合物
這次革命性的AlphaFold 3,繼續將預測範圍擴展到蛋白質、DNA、RNA以及一系列配體、
離子和化學修飾等更多生物分子結構。
AlphaFold 3建立在AlphaFold 2的基礎上,但在架構和訓練過程上有很大改進:
遺傳特徵編碼器(MSA module)被大幅簡化,聚焦在提取更關鍵的演化訊息。
成對殘基關係編碼器(Pairformer)取代了原有的演化特徵處理單元(Evoformer),增強了
複雜交互作用模式的建模能力。
結構生成器從以胺基酸為中心,改為直接預測原子座標,增加了處理通用分子結構的彈性
。
為了避免擴散方法在一些無結構區域產生幻覺,也引入了一種新的交叉蒸餾方法,透過
AlphaFold-Multimer v2預測的結構資料來豐富訓練資料。
更讓人驚嘆的是,AlphaFold 3即便在訓練資料極度匱乏的領域,也展現出了驚人的泛化
能力。
舉個例子,在CASP15的RNA預測任務中,它在10個公開標靶上的平均表現超過了專門的RNA
結構預測模型。要知道,這可是在幾乎沒有RNA訓練資料的情況下實現的。
儘管AlphaFold 3在多個維度實現了突破,但它並非完美無缺。例如在對映異構、自相互
作用等方面,它仍有一定限制。
此外,它目前專注的是分子結構的靜態預測,對動力學行為的刻畫還不夠。對人工合成分
子的適用性也有待考證。
AlphaFold 3偶爾也會產生錯誤,對無序區域產生幻覺,導致對某些目標的預測準確性降
低。
目前的緩解手段,是在生成時使用多個隨機種子,確保正確的手性並避免蛋白質-配體輕
微碰撞。
但瑕不掩瑜,AlphaFold 3的意義不僅在於具體指標的躍升,而是展示了用統一的深度學
習架構,來建模複雜生命系統組件之間相互作用的可能性。
AlphaFold開始商業化
2021年AlphaFold世代推出後,GoogleDeepMind積極為其尋找商業化途徑,並成立了
Isomorhpic Labs公司。
這次雖然以GoogleDeepMind的名義新推出了免費的AlphaFold Server,號稱科學家只需點
擊幾下就模擬由蛋白質、DNA、RNA 以及一系列配體、離子和化學修飾組成的結構。
然而Nature報告指出,科學家對AlphaFold 3伺服器的存取是有限的。目前每天只能進行
10次預測,而且不可能獲得可能與藥物結合的蛋白質結構。
Isomorphic Labs正在使用AlphaFold3透過自己的管道或與其他製藥公司合作開發藥物。
審稿人也在線上喊話哈撒比斯,自己從伺服器上得到了非常好的結果,但是發布論文
裡為什麼沒有給程式碼?
他在審查評論中列出了AlphaFold2程式碼發布後的一系列科學事件,它認為如果不公佈程
式碼就不會有這麼多科學成果。
不過,可不要小看開源社群的力量。
可能不少人論文都沒看完,開源復現工作就已經開啟了。
雖然現在還只是空倉,但網友推測,對於復現過ViT、DALL·E 2、Imagen等工作的這位大
神來說,可能幾天之內就能完成。
目前Nature已經放出的AlphaFold3論文預印版。有興趣的同學可以前去了解。
論文地址:
https://www.nature.com/articles/s41586-024-07487-w
參考連結:
[1]https://www.nature.com/articles/d41586-024-01383-z
[2]https://www.isomorphiclabs.com/articles/a-glimpse-of-the-next-
generation-of-alphafold
[3]https://github.com/lucidrains/alphafold3-pytorch
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.87.176.211 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Bioindustry/M.1715229877.A.EFF.html
推
05/15 00:21,
8月前
, 1F
05/15 00:21, 1F
噓
06/03 12:59,
7月前
, 2F
06/03 12:59, 2F
Bioindustry 近期熱門文章
PTT職涯區 即時熱門文章