人工智能和生物制藥正進(jìn)入它們各自的黃金時(shí)代,大量的新技術(shù)和新概念也在制藥行業(yè)中被提到,但藥物化學(xué)家與有機(jī)合成設(shè)計(jì)小分子技術(shù)不再被人所需要了么?人工智能如AlphaGo一般在棋類游戲中一樣,在有機(jī)合成鄰域徹底打倒了人類?
在DeepTech深科技等公眾號(hào)瘋狂宣傳下,筆者試圖用問答的形式,盡量細(xì)述藥研行業(yè)目前所需的技術(shù)發(fā)展趨勢(shì),以及眾多公眾號(hào)報(bào)道中對(duì)3月自然期刊上《Planning chemical syntheses with deep neural networks and symbolic AI 》這篇文章偏面引用的情況。
2018年3月制藥界大牛聯(lián)名發(fā)文題目為《Organic synthesis provides opportunities to transform drug discover》的文章。
聯(lián)名發(fā)文者是:
輝瑞制藥的藥物化學(xué)家Anthony Wood和David C Blakemore;
葛蘭素史克制藥公司的藥物化學(xué)家Ian Churcher;
現(xiàn)供職于BenevolentBio公司歐洲的人工智能輔助藥物研發(fā)公司;
Astex Therapeutics公司(利用"計(jì)算藥物發(fā)現(xiàn)引擎"進(jìn)行腫瘤藥物開發(fā))的藥物學(xué)家David C. Rees;
羅氏制藥藥物化學(xué)家Andrew W. Thomas;
阿斯利康制藥公司的IMED生物技術(shù)部高級(jí)總監(jiān)兼腫瘤化學(xué)全球主管David Wilson;
問題1:現(xiàn)在我們藥物研發(fā)是在如何進(jìn)行工作的呢?
David Wilson:"如下圖所示
制藥界投資合成一個(gè)或者一系列分子結(jié)構(gòu)一般從生物學(xué)假說的相關(guān)性開始,起初的藥物分子結(jié)構(gòu)價(jià)值是處于的,在這個(gè)階段我們通過大量的合成篩選分子庫(kù)來去除沒有生物活性的結(jié)構(gòu)(第一個(gè)箭頭曲線段),將有活性的分子結(jié)構(gòu)進(jìn)行官能團(tuán)優(yōu)化活性(第二個(gè)箭頭曲線),當(dāng)這個(gè)階段結(jié)束后我們可以找到1個(gè)或幾個(gè)活性的分子進(jìn)入臨床階段(第三個(gè)箭頭曲線)如果臨床有效它最終將成為藥物在市場(chǎng)上銷售。
問題2:在生物大分子藥占領(lǐng)市場(chǎng)的時(shí)代,有機(jī)化學(xué)或小分子化學(xué)在未來是不被需要的學(xué)科么?
Anthony Wood:"相反我們覺得遠(yuǎn)遠(yuǎn)還不夠,盡管學(xué)術(shù)界進(jìn)行了幾十年的開創(chuàng)性研究,但是有機(jī)合成方法學(xué)仍舊是藥物研發(fā)項(xiàng)目的瓶頸,我們需要克服它們才能使得新的方法學(xué)在藥物研發(fā)中廣泛運(yùn)用。"
我們來看一下創(chuàng)新方法學(xué)對(duì)藥物研發(fā)的相互關(guān)系:
1. 有機(jī)合成的進(jìn)度是藥物研發(fā)中的限速因素
2. 行業(yè)中復(fù)雜分子是否能被合成,對(duì)創(chuàng)新方法學(xué)研究的持續(xù)投資是必須的
我們?nèi)云惹行枰暮铣杉夹g(shù)如下:
A. 藥物分子通常含有胺基,N-雜環(huán)基團(tuán),這需要更多的合成方法來'容忍'這些結(jié)構(gòu),高收率的雜環(huán)合成以及在無保護(hù)基的情況下片段的連接,仍舊是方法學(xué)的重大難題。
例如:紅色圓圈標(biāo)注的就是化合物的含氮原子部分,這些部分要么缺乏保護(hù)基保護(hù),要么在一些反應(yīng)體系中不穩(wěn)定,這都需要開發(fā)更多的方法學(xué)的反應(yīng)來容忍它們,使其在各類反應(yīng)體系中不被干擾。
而這張圖是一些已被納入藥物分子的重要分子單元結(jié)構(gòu),我們期待更多的與它們相關(guān)反應(yīng)的方法學(xué)報(bào)道
B. C-H活化,雜環(huán)上的遠(yuǎn)程選擇性取代,C-X和C-C鍵的形成,發(fā)表的新方法學(xué)需要有更廣泛的底物適用性。
C-H活化以及成型藥物分子上的基團(tuán)修飾是重點(diǎn),它的優(yōu)點(diǎn)是可以避免我們?yōu)槊總€(gè)目標(biāo)分子去設(shè)計(jì)一條反應(yīng)路線。
雜環(huán)基團(tuán)的上的基團(tuán)引入是另一個(gè)重點(diǎn),如何在多個(gè)相似基團(tuán)上進(jìn)行區(qū)域性單獨(dú)激活的選擇性修飾(引入甲基,氟原子或小分子基團(tuán))的方法學(xué)仍舊是新的挑戰(zhàn)。尤其含氟取代基能非常好的調(diào)節(jié)藥物的代謝和親和性能,芳香雜環(huán)的含氟取代基反應(yīng)一直非常受重視。
如:Shiozaki及其同事所描述的含氟聚糖酶的抑制劑開發(fā)中遇到的問題
如下圖:
這個(gè)藥物分子的F是在起始原料中引入了經(jīng)過5步反應(yīng)得到了最終產(chǎn)物
但是我們更希望看到一個(gè)更全面的方法學(xué),使底物通過SP2和SP3機(jī)理直接在不同的位置氟化。
另一個(gè)假設(shè)的例子是:如何將-Me,-OMe,-CH2OH,-NH2,-OH,-CF3,-CHF2選擇性的插入到復(fù)雜分子的目標(biāo)位置。
我們用上圖的藥物分子Aripiprazole舉例,該化合物修飾最近被發(fā)表,作者通過C-H活化在二氯苯環(huán)部分引入了三氟甲基,以及使用光催化氧化反應(yīng)將哌 啶 環(huán)直接氧化為二酮哌 啶 環(huán)。
C. 在藥物XIAP(X連鎖凋亡抑制蛋白)合成中發(fā)現(xiàn)的我們需要開發(fā)更多脂肪族含氮雜環(huán)的反應(yīng)類型,如哌嗪,四氫呋喃,四氫吡咯等結(jié)構(gòu)。
如上圖:底物中哌嗪的兩個(gè)-CH2-都要進(jìn)行基團(tuán)修飾引入甲基與亞甲基甲氧基,但是反應(yīng)難度往往使得,我們選擇重頭合成一個(gè)含有取代基的哌嗪環(huán),但是如果可以在哌嗪環(huán)上直接插入,這將縮短反應(yīng)步驟提高合成效率。
如上圖:在這樣的底物環(huán)上直接引入甲基或者甲氧基都是一個(gè)非常低效的合成過程,以至于這樣的結(jié)構(gòu)往往在藥研項(xiàng)目最后收尾階段才會(huì)去做,這樣的進(jìn)度往往影響了初期藥物篩選的活性評(píng)估工作。
D. 隨著小分子與蛋白質(zhì),RNA,寡糖研究領(lǐng)域的學(xué)科交叉,在生物大分子上做出高選擇性的骨架修飾的反應(yīng)方法學(xué)建立變得尤其迫切。
上圖是個(gè)大的DNA編碼庫(kù),修飾這么長(zhǎng)鏈的氨基酸大分子的反應(yīng)溶劑是水,而且DNA在酸性條件下穩(wěn)定性非常差,這就需要我們開發(fā)出以水為溶劑的合成方法學(xué)。從藥物研發(fā)角度來看小分子參與的生物大分子的修飾非常關(guān)鍵,特別是在天然肽殘基上的引入,連接物需要進(jìn)行高特異性選擇性反應(yīng)。但一端是易溶于有機(jī)溶劑的藥物小分子,另一端是水溶性的生物大分子,這在反應(yīng)均向性與選擇性上給有機(jī)合成提出了挑戰(zhàn),Sharpless教授的"點(diǎn)擊化學(xué)"在這方面已經(jīng)有所突破。
藥物化學(xué)家在進(jìn)行150左右道爾頓的生物大分子上進(jìn)行小分子化合物的引入研究,通過X-RAY晶體衍射,我們發(fā)現(xiàn)在具有特殊C-H鍵位置上引入額外的非天然肽殘基對(duì)生物活性的提高非常有幫助。
E. C-C鍵活化中催化劑成本和**問題
雖然目前C-C結(jié)構(gòu)在偶聯(lián)中被開發(fā)的很完美,但是Pd催化劑仍舊昂貴很多偶聯(lián)需要使用碘化物不利于原子經(jīng)濟(jì)。
比如上圖: 鎮(zhèn)痛消炎藥物氟比洛芬合成,鎳催化劑顯示出了廉價(jià)有效的優(yōu)勢(shì),缺點(diǎn)是鎳金屬的**仍舊難以回避,如何進(jìn)一步提高原子經(jīng)濟(jì)性和降低工藝**單雜,尋找到可替代的綠色化學(xué)方法一直是行業(yè)努力的方向。
問題3:目前產(chǎn)學(xué)結(jié)合的現(xiàn)狀是?能簡(jiǎn)單介紹一下嗎?
Anthony Wood:"目前制藥界需要依靠學(xué)術(shù)界的創(chuàng)新力和人才輸送,學(xué)術(shù)界既開創(chuàng)新的方法學(xué)又為制藥界培養(yǎng)有機(jī)合成學(xué)科的學(xué)生。產(chǎn)學(xué)結(jié)合有多種形式,包括聯(lián)合發(fā)表學(xué)術(shù)期刊,達(dá)成商業(yè)合作等。
近年來其中比較矚目的機(jī)構(gòu)有:
普林斯頓大學(xué)和默克公司合作的普林斯頓-默克催化中心:https://chemistry.princeton.edu/research-facilities/merck-catalysis-center
美國(guó)選擇性C-H功能化研究中心:http://www.nsf-cchf.com/index.htm
牛津大學(xué)生物醫(yī)學(xué)和生物綜合博士生培訓(xùn)中心:http://www.oxfordsynthesiscdt.ox.ac.uk
制藥行業(yè)非常重視分享新方法學(xué)的通用經(jīng)驗(yàn)以及改善方法學(xué)局限性的經(jīng)驗(yàn)交流,我們希望多國(guó)學(xué)術(shù)機(jī)構(gòu)的跨學(xué)科的競(jìng)爭(zhēng)合作變得更加平凡,最終出現(xiàn)全球聯(lián)動(dòng)的巨型項(xiàng)目,如:大型量子對(duì)撞機(jī)或人類基因組學(xué)計(jì)劃這樣的體量。
問題4:近年來迅猛發(fā)展的人工智能呢?蒙特卡洛法和神經(jīng)網(wǎng)絡(luò)正在進(jìn)入藥物合成領(lǐng)域?
有機(jī)分子逆合成設(shè)計(jì)由偉大的化學(xué)家Elias James Corey提出的,由目標(biāo)分子逆推合成出更簡(jiǎn)單的片段加以拼接。但目前計(jì)算機(jī)輔助逆合成程序如Chematica等,仍舊很慢且提供的結(jié)果并不理想。
人類化學(xué)家設(shè)計(jì)特點(diǎn)是是優(yōu)先考慮最可行的合成方法,但是那些設(shè)計(jì)反應(yīng)的策略并不會(huì)全部奏效。一般原因可能是分子空間位阻或基團(tuán)受到吸電子給電子效應(yīng)的影響,以及設(shè)計(jì)者對(duì)反應(yīng)機(jī)理不完全理解或不理解分子架構(gòu)的情況。這是阻礙人類化學(xué)家最終得到目標(biāo)分子化合物的障礙。
計(jì)算機(jī)輔助程序Chematica等雖然可以幫助化學(xué)家更快的找到合成路線,但是它并沒有擴(kuò)展到令化學(xué)家信服的水準(zhǔn),簡(jiǎn)單的從反應(yīng)數(shù)據(jù)庫(kù)中提取合成方法,已經(jīng)被批評(píng)為粗放和缺乏"化學(xué)智慧"。
今年已經(jīng)有不少研究小組使用蒙特卡洛樹,擴(kuò)展策略網(wǎng)絡(luò)與篩選網(wǎng)絡(luò)結(jié)合,使計(jì)算機(jī)可以預(yù)先選擇最有希望成功的合成反應(yīng)步驟,這些程序都是針對(duì)有機(jī)化學(xué)方法學(xué)中已發(fā)表的反應(yīng)進(jìn)行開發(fā)。該方法依靠學(xué)習(xí)反應(yīng)合成規(guī)則和使用啟發(fā)式算法,差不多比Chematica方法要快上30倍。
神經(jīng)網(wǎng)絡(luò)模仿了專家在設(shè)計(jì)路線上的直覺決策,在有希望成功的方向上進(jìn)行啟發(fā)式搜索。但不幸的是人工智能的分類系統(tǒng)必須通過成功和失敗雙向訓(xùn)練,才能明白如何從中發(fā)現(xiàn)高收益反應(yīng),在通過使用Reaxys數(shù)據(jù)庫(kù)做模擬時(shí),AI發(fā)現(xiàn)關(guān)于失敗反應(yīng)的報(bào)道很少,這些隱含信息的缺失是目前影響該系統(tǒng)進(jìn)化的一個(gè)大問題。
上圖反應(yīng)是由人工智能自己設(shè)計(jì)的,藍(lán)色和紅色標(biāo)記是其'思考'后決定的反應(yīng)切斷點(diǎn),這個(gè)過程只花費(fèi)5.4秒,與最終文獻(xiàn)報(bào)道一致,體現(xiàn)出人工智能設(shè)計(jì)快速高效的一面。
但是到了人機(jī)對(duì)抗實(shí)驗(yàn)時(shí)情況變得非常有趣
反應(yīng)設(shè)計(jì)中人類化學(xué)家和AI為了得到化合物5使用了2條不同的合成路線以及不同的初始底物。
人工智能選擇了Seyferth-Gilbert增碳反應(yīng),它使用了 不常用的Ohira-Bestmann試劑。
但人類化學(xué)家則選擇了多2個(gè)碳鏈的底物使用格氏反應(yīng)和脫保護(hù)來得到化合物5.
然后從化合物5到目標(biāo)化合物,人類和人工智能的選擇都保持一致。
雖然人工智能選擇的合成路線也合理,但是這并非常規(guī)使用的化學(xué)合成反應(yīng),由于底物選擇上的不同,以及不考慮保護(hù)基的簡(jiǎn)化反應(yīng)物的內(nèi)在邏輯策略,暴露出了使用AI啟發(fā)式搜索思考出的合成路線的缺點(diǎn)。路線1在人類逆合成策略中會(huì)被批評(píng)為典型的路線設(shè)計(jì)錯(cuò)誤,因此AI仍舊需要花費(fèi)大量時(shí)間由人類專家在策略選擇上持續(xù)進(jìn)行訓(xùn)練升級(jí)。
目前人工智能遇到的3大挑戰(zhàn)導(dǎo)致其難以開發(fā)出更強(qiáng)大的啟發(fā)性算法:
1. 無法對(duì)什么是人類化學(xué)家口中的一條好的合成路線下定義
2. 人工智能希望簡(jiǎn)化合成步驟和中間化合物,所以會(huì)出現(xiàn)一些一鍋法反應(yīng),但是AI機(jī)理避免保護(hù)基的保護(hù)與脫保護(hù)策略可能在反應(yīng)設(shè)計(jì)中是有很好收益的。
3.需要解決人工智能對(duì)底物解構(gòu)的選擇'本能的'會(huì)向極簡(jiǎn)靠攏和催化劑的選擇未能考慮有效性與易得性。
總體來說AI未來在能顯著提高尋找先導(dǎo)化合物反應(yīng)設(shè)計(jì)的有效率。人工智能將會(huì)對(duì)化合物的設(shè)計(jì)有很好的輔助,該技術(shù)在提高合成新分子的效率和降低成本方面的潛力巨大。
但目前的發(fā)展情況告訴我們一切新興技術(shù)只是剛起步,AI完全取代人類也并非如想象中那么簡(jiǎn)單。
相關(guān)資料:Nature Chemistry volume 10, pages383-394 (2018)
Nature volume 555, pages 604-610 (29 March 2018)
Angewandte chemie.Volume55, Issue44.October 24, 2016.Pages
13650-13657
Science 26 Jan 2018:Vol. 359, Issue 6374, pp. 429-434
作者簡(jiǎn)介:陳斌,復(fù)旦藥學(xué)院研究生,研究方向:天然產(chǎn)物活性成分的藥物分析方法學(xué)建立,天然藥物的質(zhì)量控制研究,發(fā)表《多種生產(chǎn)工藝對(duì)市售門冬氨酸鉀鎂注射制劑質(zhì)量影響的評(píng)價(jià)》。
合作咨詢
肖女士 021-33392297 Kelly.Xiao@imsinoexpo.com