中山大學(xué)和阿里云的聯(lián)合研究團(tuán)隊(duì)發(fā)現(xiàn)了超過(guò)16萬(wàn)個(gè)RNA病毒,他們的突破性成果在國(guó)際知名期刊《Cell》上發(fā)表。
發(fā)布時(shí)間:2024-10-10 點(diǎn)擊數(shù):879
中山大學(xué)和阿里云的聯(lián)合研究團(tuán)隊(duì)發(fā)現(xiàn)了超過(guò)16萬(wàn)個(gè)RNA病毒,他們的突破性成果在國(guó)際知名期刊《Cell》上發(fā)表。
本文來(lái)源:錢(qián)江晚報(bào)
10月10日消息,國(guó)際頂級(jí)學(xué)術(shù)期刊《Cell》發(fā)表了中山大學(xué)與阿里云合作的科研成果,研究團(tuán)隊(duì)利用云計(jì)算與AI技術(shù)發(fā)現(xiàn)了180個(gè)超群、16萬(wàn)余種全新RNA病毒,是已知病毒種類(lèi)的近30倍,大幅提升了業(yè)界對(duì)RNA病毒多樣性和病毒演化歷史的認(rèn)知。

中山大學(xué)、阿里云聯(lián)合研究成果在國(guó)際頂刊《Cell》發(fā)表
《Cell》是國(guó)際公認(rèn)學(xué)術(shù)聲譽(yù)最高的期刊,代表生命科學(xué)領(lǐng)域的最高水平。國(guó)內(nèi)每年入選《Cell》的論文數(shù)量?jī)H有數(shù)十篇。此次入選的論文提出了一種基于深度學(xué)習(xí)的RNA病毒發(fā)現(xiàn)方法,是深度學(xué)習(xí)算法在病毒發(fā)現(xiàn)領(lǐng)域的里程碑式進(jìn)展,為病毒學(xué)研究開(kāi)創(chuàng)了全新范式。
病毒與人類(lèi)的健康密切相關(guān),但人類(lèi)已知已確認(rèn)的病毒種類(lèi)僅有5000余種,這只是病毒世界的冰山一角。傳統(tǒng)RNA病毒鑒定方法高度依賴(lài)于序列同源性比對(duì),即通過(guò)比較未知病毒與已知病毒的序列相似性來(lái)進(jìn)行識(shí)別。然而,RNA病毒種類(lèi)繁多且高度分化,傳統(tǒng)方法難以捕捉缺乏同源性或同源性極低的“暗物質(zhì)病毒”,新病毒發(fā)現(xiàn)的效率較低。
AI與病毒學(xué)研究的結(jié)合正在突破這一難題。本篇論文提出了全新的深度學(xué)習(xí)模型"LucaProt",它基于Transformer框架與大模型表征技術(shù),結(jié)合蛋白質(zhì)序列和內(nèi)在結(jié)構(gòu)性特征,在獨(dú)立的測(cè)試數(shù)據(jù)集上表現(xiàn)優(yōu)異,具有極高的準(zhǔn)確性(假陽(yáng)性率僅為0.014%)和特異性(假陰性率為1.72%)。

論文圖表之一
據(jù)介紹,研究團(tuán)隊(duì)對(duì)來(lái)自全球生物環(huán)境樣本的10487份數(shù)據(jù)進(jìn)行病毒挖掘,發(fā)現(xiàn)了513234條病毒基因組,代表161979個(gè)潛在病毒種及180個(gè)RNA病毒超群。使RNA病毒超群數(shù)量擴(kuò)容約9倍,病毒種類(lèi)增加約30倍,其中23個(gè)超群無(wú)法通過(guò)序列同源方法識(shí)別,被稱(chēng)為病毒圈的“暗物質(zhì)“。
該論文還揭示了多個(gè)病毒學(xué)領(lǐng)域新發(fā)現(xiàn):發(fā)現(xiàn)迄今為止最長(zhǎng)的RNA病毒基因組,長(zhǎng)度達(dá)到47250個(gè)核苷酸;識(shí)別出超出以往認(rèn)知的基因組結(jié)構(gòu),展示了RNA病毒基因組進(jìn)化的靈活性;此外,在高溫的深海熱泉等極端環(huán)境中,RNA病毒依舊存在多樣性。
中山大學(xué)醫(yī)學(xué)院教授施莽表示:“在科研領(lǐng)域,AI的應(yīng)用已經(jīng)勢(shì)不可擋,通過(guò)AI方法探索科學(xué)問(wèn)題已取得了重要突破。這種研究范式將成為未來(lái)科學(xué)界的常態(tài),也可能成為我們認(rèn)知世界的重要手段。”
該論文共同第一作者、阿里云飛天實(shí)驗(yàn)室算法專(zhuān)家賀勇表示:“基于AI+病毒學(xué)的新研究框架刷新了人類(lèi)對(duì)病毒圈的認(rèn)識(shí),隨著這種認(rèn)識(shí)的不斷完善,有助于人類(lèi)對(duì)未來(lái)可能發(fā)生的大流行進(jìn)行預(yù)警,以及進(jìn)一步推動(dòng)RNA病毒疫苗的研發(fā)。”
據(jù)悉,過(guò)去幾年,阿里云積極與國(guó)內(nèi)高校和研究機(jī)構(gòu)展開(kāi)合作,在生命科學(xué)領(lǐng)域已發(fā)表核酸和蛋白質(zhì)統(tǒng)一基礎(chǔ)模型-LucaOne、RNA病毒發(fā)現(xiàn)-LucaProt、磷循環(huán)蛋白家族識(shí)別-LucaPCycle等研究成果。
免責(zé)聲明:該文章系我網(wǎng)轉(zhuǎn)載,旨在為讀者提供更多新聞資訊。所涉內(nèi)容不構(gòu)成投資、消費(fèi)建議,僅供讀者參考。