日前,上海人工智能實(shí)驗(yàn)室聯(lián)合崖州灣國(guó)家實(shí)驗(yàn)室和中國(guó)農(nóng)業(yè)大學(xué)等單位,推出生物育種領(lǐng)域首個(gè)自主科學(xué)發(fā)現(xiàn)系統(tǒng)“豐登·基因科學(xué)家”。該系統(tǒng)基于首個(gè)種業(yè)大模型“豐登”研發(fā),能模擬分子生物學(xué)家自主開展作物基因功能研究。在它的輔助下,科研人員在主糧作物中成功發(fā)現(xiàn)了數(shù)十個(gè)此前未被報(bào)道的基因功能,并獲得實(shí)驗(yàn)證實(shí)。
“豐登·基因科學(xué)家”的誕生,填補(bǔ)了我國(guó)在生物育種領(lǐng)域自主科學(xué)發(fā)現(xiàn)系統(tǒng)的技術(shù)空白,有望提高作物分子設(shè)計(jì)育種效率,縮短育種周期,提升作物品質(zhì),為我國(guó)種業(yè)創(chuàng)新提供有力支撐。
作物育種的核心是精準(zhǔn)改造基因組以優(yōu)化農(nóng)藝性狀,這需要系統(tǒng)理解基因與性狀的關(guān)系。然而,傳統(tǒng)基因功能研究高度依賴專家經(jīng)驗(yàn),周期長(zhǎng)且效率低。以水稻育種為例,自2005年全基因組測(cè)序完成以來,全球已投入大量資金用于其基因功能研究。但根據(jù)“豐登”大語言模型對(duì)全球文獻(xiàn)的系統(tǒng)分析,目前仍有約90%的水稻基因功能尚未明確。而玉米、大豆等主要作物的未知功能基因比例更高。
如何高效破譯從基因到性狀的“黑盒”?聯(lián)合團(tuán)隊(duì)基于“豐登”大語言模型研發(fā)了可進(jìn)行自主科學(xué)發(fā)現(xiàn)的科研智能體“豐登·基因科學(xué)家”。為幫助這位AI科學(xué)家快速學(xué)習(xí),研發(fā)團(tuán)隊(duì)繪制了兩套全新“思維導(dǎo)圖”:一套是基于全球?qū)W術(shù)論文、專業(yè)著作和實(shí)驗(yàn)數(shù)據(jù)的“基因-性狀-環(huán)境”三維知識(shí)圖譜;另一套則是包含30萬條“假設(shè)-實(shí)驗(yàn)-結(jié)論”推理鏈的科研路徑圖譜——據(jù)此,不光告訴AI科學(xué)家基因與性狀、基因與環(huán)境之間的關(guān)系,還把人類科學(xué)家預(yù)測(cè)推理作物基因功能的方法傳授給它。 通過強(qiáng)化學(xué)習(xí),“豐登·基因科學(xué)家”可模擬專家推理過程,自動(dòng)完成從提出假設(shè)到設(shè)計(jì)實(shí)驗(yàn)、再到分析結(jié)果的完整科研流程,由此構(gòu)建高效、可擴(kuò)展的基因功能發(fā)現(xiàn)體系。 這位“學(xué)有所成”的AI科學(xué)家究竟靠不靠譜?研究團(tuán)隊(duì)選取了水稻、玉米等數(shù)十個(gè)未報(bào)道的功能基因,除具體實(shí)驗(yàn)操作外,知識(shí)歸納總結(jié)、性狀關(guān)聯(lián)預(yù)測(cè)、研究方案設(shè)計(jì)及路線規(guī)劃等科研決策環(huán)節(jié)均由智能體完成。測(cè)試結(jié)果顯示,“豐登·基因科學(xué)家”在知識(shí)整合、功能推斷與實(shí)驗(yàn)設(shè)計(jì)等環(huán)節(jié)表現(xiàn)突出,多項(xiàng)量化指標(biāo)優(yōu)于國(guó)際主流OpenManus智能體與DeepSeek-R1語言模型。 在水稻研究中,科研人員依據(jù)“豐登·基因科學(xué)家”設(shè)計(jì)的多輪實(shí)驗(yàn)方案開展實(shí)驗(yàn),發(fā)現(xiàn)了多個(gè)基因的新功能。比如,有基因可通過調(diào)控植物激素平衡影響株高,另有多個(gè)基因與光合效率密切相關(guān)。在玉米研究中,智能體精準(zhǔn)預(yù)測(cè)出多個(gè)與株高、穗位等關(guān)鍵農(nóng)藝性狀緊密相關(guān)的候選基因,相關(guān)結(jié)論與連續(xù)三年獨(dú)立開展的田間試驗(yàn)結(jié)果高度一致。 來源:上觀新聞