
設計蛋白質生物材料的可視化示例。
圖片來源:馬庫斯·比勒/《應用物理學雜志》
科技日報北京8月29日電 (記者張夢然)美國麻省理工學院研究人員在新一期《應用物理學雜志》發(fā)表的論文中,將注意力神經網絡與圖神經網絡相結合,以更好地理解和設計蛋白質。該方法將幾何深度學習與語言模型的兩種優(yōu)勢結合起來,不僅可預測現有蛋白質特性,還可設想自然界尚未設計出的新蛋白質。
蛋白質通過構建塊的獨特排列來執(zhí)行大量生物任務。將這個幾乎無限的排列庫轉化為各自的功能,就可讓研究人員設計用于特定用途的定制蛋白質。
但蛋白質一直難以建模,尤其是人們想要“反向操作”——將所需的功能轉化為蛋白質結構,更是一個高難度挑戰(zhàn)。
此次新模型就可通過對基本原理建模,將大自然發(fā)明的一切作為基礎,重新組合了這些自然構建塊,能實現新功能并解決多類型任務。
新建模型將數字、描述、任務和其他元素轉化為符號供神經網絡使用。團隊首先訓練模型,根據不同蛋白質的功能來預測它們的序列、溶解度和氨基酸組成部分。然后,在收到新蛋白質功能的初始參數后,教它發(fā)揮創(chuàng)造力并生成全新的結構。
這種方法能創(chuàng)造出以前必須溶解在水中的固體抗菌蛋白。在另一個例子中,團隊采用了一種天然存在的絲蛋白,并將其進化成各種新形式,包括賦予其螺旋形狀或褶皺結構,讓其具有彈力和韌性。
研究人員表示,該技術的廣泛性意味著這一模型能應用于蛋白質設計之外的許多領域,如設計具有特定失效模式的材料。
【總編輯圈點】
蛋白質,生命的物質基礎,它一直是生命科學領域的研究重點和熱點。人們孜孜不倦,想要了解它、改造它甚至創(chuàng)造它。人工智能已成為蛋白質研究的“黃金搭檔”之一,它被用來做蛋白質結構預測,創(chuàng)建蛋白質分子。此次,深度學習和語言模型結合,新的蛋白質應運而生。先設定蛋白質的功能,再生成蛋白質的結構,知道想要什么,便可以創(chuàng)造什么。這種蛋白質能解決現實問題,執(zhí)行特定任務。盡管提需求吧,剩下的交給神經網絡去完成。