近日,來自瑞士洛桑聯(lián)邦理工學(xué)院(EPFL)的科學(xué)家們建立了一個(gè)名為ShiftML的機(jī)器學(xué)習(xí)程序,用來預(yù)測(cè)分子中的原子在磁場(chǎng)中的移動(dòng)狀況。這項(xiàng)研究發(fā)表在了《Nature Communications》上,表明AI可以幫助化學(xué)家們用比傳統(tǒng)建模方法更快的方式,來破解晶體的分子結(jié)構(gòu)。
如今的許多藥物都是以粉末狀固體的形式生產(chǎn)出來的。但是,要想充分了解藥物中的活性成分進(jìn)入體內(nèi)之后會(huì)如何表現(xiàn),科學(xué)家們需要知道它們的確切原子結(jié)構(gòu),通常會(huì)采用核磁共振和密度泛函理論相結(jié)合的技術(shù)。
核磁共振技術(shù)通常用于探測(cè)原子之間的磁場(chǎng),并確定相鄰原子之間是如何相互作用的。然而,通過核磁共振測(cè)定完整的晶體結(jié)構(gòu),需要極其復(fù)雜且非常耗時(shí)的量子化學(xué)計(jì)算,這對(duì)于結(jié)構(gòu)非常復(fù)雜的分子而言難度非常大,同時(shí)需要配合密度泛函理論(DFT)技術(shù)來進(jìn)行計(jì)算工作。DFT技術(shù)使用復(fù)雜的量子化學(xué)計(jì)算來映射特定區(qū)域內(nèi)的電子密度,這個(gè)過程中需要進(jìn)行非常大量的計(jì)算。
為了優(yōu)化這個(gè)過程,研究人員開發(fā)出了一個(gè)名為ShiftML的機(jī)器學(xué)習(xí)工具,可以用更快的速度來完成計(jì)算工作,并且在某些情況下可以像DFT程序一樣準(zhǔn)確地執(zhí)行。研究人員利用來自Cambridge Structural Database的數(shù)據(jù)對(duì)ShiftML進(jìn)行了訓(xùn)練,其中2000個(gè)化合物結(jié)構(gòu)用于對(duì)ShiftML的訓(xùn)練和驗(yàn)證,另外500個(gè)用于對(duì)其進(jìn)行測(cè)試。該數(shù)據(jù)庫包含數(shù)千種化合物計(jì)算得出的DFT化學(xué)位移,其中每一個(gè)化合物都由不到200個(gè)原子組成。研究人員表示,即使對(duì)于相對(duì)簡(jiǎn)單的分子,ShiftML的計(jì)算速度也比現(xiàn)有的方法快了將近1萬倍。
對(duì)于更加復(fù)雜的化合物,這一優(yōu)勢(shì)將會(huì)更加明顯。舉例來說,ShiftML對(duì)一個(gè)分子的化學(xué)位移進(jìn)行計(jì)算,這個(gè)分子由86個(gè)原子構(gòu)成,其化學(xué)元素和可 卡 因相同,但排列成了不同的晶體結(jié)構(gòu)。整個(gè)計(jì)算過程花費(fèi)的CPU時(shí)間不到一分鐘。相比之下,使用DFT技術(shù)計(jì)算同樣一個(gè)分子的化學(xué)位移,需要的CPU時(shí)間大約為62至150小時(shí)。
研究小組希望未來的ShiftML可以用來輔助藥物設(shè)計(jì)工作。“這項(xiàng)研究是非常令人興奮的,因?yàn)榇蠓燃铀儆?jì)算時(shí)間可以讓我們能夠覆蓋更大的構(gòu)象空間,并準(zhǔn)確界定那些以前無法確定的結(jié)構(gòu),”研究論文的共同作者之一、EPFL的化學(xué)教授Lyndon Emsley博士表示:“ShiftML可以讓現(xiàn)代的大多數(shù)復(fù)雜藥物分子觸手可及。”
如今,ShiftML已經(jīng)可以開源使用,任何人都可以在平臺(tái)上上傳分子,并獲得其核磁共振特征。
合作咨詢
肖女士 021-33392297 Kelly.Xiao@imsinoexpo.com