科技日報記者 劉霞
英國《自然》網(wǎng)站近日報道了迄今最大的生物學(xué)人工智能(AI)模型Evo 2。該模型基于12.8萬個基因組的數(shù)據(jù)進行訓(xùn)練,具備從頭編寫整個染色體和小基因組的能力,為設(shè)計全新基因組開辟了一條新路。
在前一代模型Evo 1的基礎(chǔ)上,來自美國弧形研究所、斯坦福大學(xué)和英偉達公司的科學(xué)家攜手開發(fā)出Evo 2。相較于Evo 1在8萬個細菌、古細菌及病毒的基因組數(shù)據(jù)上進行的訓(xùn)練,Evo 2的訓(xùn)練數(shù)據(jù)量大幅提升,涵蓋了12.8萬個基因組。這些基因組廣泛涉及人類、動植物及真核生物,囊括了9.3萬億個核苷酸。
團隊表示,鑒于解析這些數(shù)據(jù)及其他特征所需的龐大算力,Evo 2是迄今發(fā)布最大的生物學(xué)AI模型。Evo 1和Evo 2模型作為“生成式生物學(xué)”這一新興領(lǐng)域的重要成果,將進一步加強對生命基本組成部分的了解。
在醫(yī)療保健和新藥研發(fā)領(lǐng)域,Evo 2模型可幫助了解與特定疾病有關(guān)的基因變體。在針對與乳腺癌相關(guān)的BRCA1基因變體測試中,Evo 2在預(yù)測良性突變和潛在致病突變方面的準(zhǔn)確率達90%以上。這將有助于節(jié)省大量時間,精確設(shè)計出靶向這些變體的新型分子。
此外,在農(nóng)業(yè)方面,Evo 2模型可提供有關(guān)植物生物學(xué)的新見解,助力開發(fā)出更具氣候適應(yīng)性或營養(yǎng)更豐富的作物品種,為解決全球糧食短缺問題貢獻力量。在材料科學(xué)領(lǐng)域,Evo 2模型可用于設(shè)計生物燃料或分解石油、塑料的蛋白質(zhì)。
團隊表示,Evo 2已向全球科研人員開放,他們可通過網(wǎng)頁便捷使用該模型,或免費下載該模型的源代碼、訓(xùn)練數(shù)據(jù)及參數(shù),共同探索生物學(xué)的奧秘。