DeepMind 研究新突破 以人工智能預測蛋白質 3D 結構
說到 DeepMind ,相信大部份人都會想起數年前的圍棋大賽。不過,這間 Google 旗下公司的最新研究成果 AlphaFold ,成功利用人工智能 (AI) 幫助找出蛋白質的立體結構。
蛋白質是由不同胺基酸 (amino acid) 所組成,更是生命構成的重要結構。蛋白質的運作機制和相應功能,都是取決於其立體形狀結構。要找出它們的結構,其中一類方法是透過被稱為「黃金標準」的實驗方法 —— X 光晶體學 (Crystallography) 或者用低溫電子顯微鏡 (Cryo-EM) 。
另一方法則是透過電腦運算,嘗試推測胺基酸序列會組成甚麼形狀的蛋白質結構,以加快涉及蛋白質結構的研究工作。然而,初期的電腦模擬技術運算所得的結果強差人意,未能準確、有效地推斷到蛋白質形狀。
馬里蘭大學計算生物學家 John Moult 因此就在 1994 年設立雙年舉行的蛋白結構預測挑戰賽 (Critical Assessment of Structure Prediction, CASP) 。繼 2018 年後,DeepMind 今年再參與 CASP,但今屆他們所研發的人工智能系統 AlphaFold 表現不僅比另外約 100 隊參加隊伍理想,而且有份評審的科學家更形容為可預示生物學新一場革命。
在今次挑戰中, DeepMind AlphaFold 在預測部份蛋白結構時,表現甚至與有「黃金標準」之稱的實驗方法所得的結果一樣。短期內, AlphaFold 雖未能直接取替最標準、可靠的黃金標準,但現時仍協助科學家以新方法研究蛋白質結構。
帶領開發 AlphaFold 的 DeepMind 科學家 John Jumper 解釋,最初他們將預測系統分作兩部份,首先透過深度學習從結構及基因數據中,尋找著蛋白質內胺基酸對距離的模式,之後再以此設計出一套運算模型預測蛋白結構。然而,他們發現此方法效果不太理想, DeepMind 研究人員再在 AI 系統中,加入一些物理及幾何結構的限制後,直接訓練系統預測結構,而非胺基酸關係的模式。
Moult 指,所有隊伍在今屆比賽中表現都比去年出色。其中,在中等難度的題目中,各隊最高得分平均為 75 分(100 分為滿分),但 DeepMind 表現尤其出眾,獲得約 90 分的佳績。除 DeepMind 外,不少學術研究隊伍,以及微軟和騰訊都有派出隊伍參與。
DeepMind 創辦人之一的 Demis Hassabis 計劃將 AlphaFold 改造,讓系統更適合生物學家使用。他們的團隊也公開發表了初代 AlphaFold 的研究成果,可供科學家參考。不過, Hassabis 指現時系統仍須一段時間才可預測到蛋白立體結構,而他們也在了解生物學家對系統有甚麼特別需求,相信將可應用於藥物開發或者蛋白質設計中。 DeepMind 年初也發表了他們對於武漢肺炎病毒 (SARS-CoV-2) ,其中一種名為 Orf3a 蛋白結構的預測,而結果也與實驗觀察到的相近。