◎ 本報特約作者 王初
當地時間10月9日,瑞典皇家科學院宣布將2024年諾貝爾化學獎頒給3位科學家。其中兩位是Foldit的開創人——英國科學家德米斯·哈薩比斯(Demis Hassabis)和美國科學家約翰·江珀(John M. Jumper),表彰他們在蛋白質結構預測方面取得的成就;另外一位是我的導師——美國華盛頓大學生物化學家戴維·貝克(David Baker),表彰他在計算蛋白質設計方面的貢獻。
我于2001年來到美國華盛頓大學生物化學系攻讀博士學位,機緣巧合下通過實驗室的輪轉來到戴維·貝克實驗室,一直到2008年博士后項目結束。在與戴維的接觸過程中,我感覺到他是一個天生的非常純粹的科學家,并且他把自己的全部精力都傾注于科學研究,總會有很多原創的想法,并能將這些想法付諸實施。
因何設計蛋白質
戴維執著于“蛋白質設計革命”(protein-design revolution)。他說,這場革命與人類歷史上發生過的其他科技革命類似:學會控制金屬,讓人類走出了石器時代;在工業革命中,人們學會了用蒸汽機來操控機器;而在這之后,數字革命又讓人們能在計算機中存儲信息。現在,通過“蛋白質設計革命”,人們將學會用前所未有的方式操控生物分子。“我們將可以用蛋白質制造出新的藥物、疫苗、疾病療法甚至新的材料。”
蛋白質是生命活動的直接執行者,其結構與功能由氨基酸一級序列所決定。上個世紀90年代,貝克研究組開始進行Rosetta軟件包的開發,嘗試對蛋白質結構進行計算模擬與預測。該方法的基本策略是通過Rosetta搜索了所有已知蛋白質結構的數據庫,并尋找與目標蛋白序列相似的蛋白質短片段。利用蛋白質能量分布的基礎知識,Rosetta再對這些片段進行優化獲得完整蛋白結構。
1998年,Rosetta在蛋白質結構預測雙盲競賽CASP中首次亮相,與其他參賽者相比,它表現出非常好的預測效果。這一成功導致了貝克團隊產生了一個新的想法——與在Rosetta中輸入氨基酸序列并輸出蛋白質結構相比,他們可以使用Rosetta的反向功能,即輸入所需的蛋白質結構并獲得其氨基酸序列的建議,這將使他們能夠創建全新的蛋白質結構。如果能實現從零開始設計蛋白質結構和功能,這意味著人們可以創造出具有各種功能的全新的生命活動執行者,并將其應用于生物醫學研究的方方面面。
構建全新蛋白質“從頭設計”
構建全新蛋白質的領域被稱為“從頭設計”(de novo design)。針對該目標,貝克團隊繪制了一種當時在數據庫中不存在的具有全新蛋白質結構,然后讓Rosetta通過能量計算哪種氨基酸序列可以折疊這種結構,然后在此基礎上繼續優化改進,直到完成從氨基酸序列到蛋白質結構再回到氨基酸序列的閉環設計。貝克研究小組將建議的氨基酸序列的基因引入細菌中,通過細菌表達產生所需的蛋白質并后續純化。然后他們使用X射線晶體學確定了蛋白質結構。結果表明,實驗解析的結構與Rosetta軟件設計的結構完全一致。由于該蛋白是經由7輪設計產生,研究人員將這個蛋白質命名為Top7。
Top7的成功對從事蛋白質設計的研究人員來說是一個驚喜。那些以前設計的蛋白質的人只能模仿現有結構。Top7的獨特結構在自然界中不存在。此外,由93個氨基酸組成的蛋白質,比以前使用從頭開始設計方法產生的任何蛋白質都要大,而且由于經過多輪的設計和優化,這個蛋白也比同等大小的天然蛋白質更加穩定。
貝克課題組于2003年發表了這項發現,這是令人驚嘆的發展的第一步。鑒于蛋白質的結構可以決定其性質和功能,這為創建具有新功能的定制蛋白質奠定了重要的基礎。在之前的蛋白質設計和工程化研究中,研究人員大多是通過調整現有的蛋白質,以便它們能夠產生新的功能(例如,分解有害物質或作為化學制造行業中的工具)。然而,天然蛋白質的范圍有限。為了增加獲得具有全新功能的蛋白質的潛力,貝克研究小組在TOP7成功后,希望從頭開始創建它們。正如戴維所說,“如果你想建造一架飛機,你不應該從修改一只鳥開始;相反,你應該了解空氣動力學的第一原理,并根據這些原理建造飛行器。”
改變新藥發現和開發模式
在過去的20多年里,戴維實驗室中涌現出許多令人矚目的蛋白質創造,他還發布了Rosetta的代碼,因此全球的研究團體都在繼續開發該軟件,尋找新的應用領域。
基于在蛋白設計領域的深厚經驗積累和深度學習算法帶來的計算模式突破,戴維實驗室近年在蛋白設計領域的突破可以用日新月異來形容。從開發出一秒設計全新蛋白的工具,到設計可靶向任意蛋白的抗體,他的團隊一次又一次地顛覆蛋白設計的規則。這些在基礎科學領域的突破也正在通過初創公司的創建改變新藥發現和開發的模式。戴維參與創建了超過10家生物技術公司,其中今年浮出水面的Xaira Therapeutics公司由ARCH Venture Partners和Foresite Labs共同孵化,獲得啟動融資金額超過10億美元。
Rosetta軟件是基于蛋白質的生物物理特征,根據氨基酸序列計算預測蛋白的三維結構。然而,預測蛋白三維結構需要大量的計算力和時間,戴維在哲學和社會學方面的經驗讓他想到了利用團體的力量來解決這個問題。他說,“我的理想是全球各地的人們都可以同心協力,為科學和全球健康做出重要的貢獻。”2004年,他的實驗室開發出的名為Rosetta@home的軟件,使得任何人都可以在自己家里的計算機上下載這款軟件,為解析某些蛋白結構的運算出一份力。在不到4年的時間里,接近20萬志愿者在自己的計算機上裝載了這款軟件,為蛋白質結構預測做出貢獻。
(作者:王初,博士,北京大學化學與分子工程學院教授。本文編輯:朱廣清)
友情鏈接: 政府 高新園區合作媒體
Copyright 1999-2024 中國高新網chinahightech.comAll Rights Reserved.京ICP備14033264號-5
電信與信息服務業務經營許可證060344號主辦單位:《中國高新技術產業導報》社有限責任公司