基于量子化學(xué)計(jì)算和機(jī)器學(xué)習(xí),從頭開始創(chuàng)建肉眼可檢測(cè)的熒光分子
設(shè)計(jì)熒光分子需要考慮多種相互關(guān)聯(lián)的分子特性,而不是與分子結(jié)構(gòu)直接相關(guān)的特性,例如分子的光吸收。
在這項(xiàng)研究中,RIKEN 高級(jí)智能項(xiàng)目研究中心和東京大學(xué)等機(jī)構(gòu)的研究人員合作,使用從頭分子生成器(DNMG)與量子化學(xué)計(jì)算(QC)相結(jié)合來開發(fā)熒光分子,這些分子在各個(gè)學(xué)科中都引起了廣泛關(guān)注。使用大規(guī)模并行計(jì)算(1024 核,5 天),DNMG 產(chǎn)生了 3643 個(gè)候選分子。
研究人員選擇了一個(gè)未報(bào)道的分子和七個(gè)報(bào)道的分子并合成了它們。光致發(fā)光光譜測(cè)量表明,DNMG 可以以 75% 的準(zhǔn)確度(n = 6/8)成功設(shè)計(jì)熒光分子,并產(chǎn)生一種未報(bào)告的分子,該分子發(fā)出肉眼可檢測(cè)到的熒光。
該研究以「De novo creation of a naked eye–detectable fluorescent molecule based on quantum chemical computation and machine learning」為題,于 2022 年 3 月 9 日發(fā)布在《Science Advances》。
簡(jiǎn)介
熒光化合物作為可見光發(fā)射體在多個(gè)學(xué)科的應(yīng)用中非常重要,包括有機(jī)發(fā)光二極管、傳感器和生物成像。盡管已經(jīng)為這些和其他應(yīng)用開發(fā)了許多熒光分子,但不斷需要新的分子來解決當(dāng)前材料在功能、可持續(xù)性和低成本方面的缺點(diǎn)。即使是化學(xué)結(jié)構(gòu)的細(xì)微變化也可能導(dǎo)致重大改進(jìn)。
熒光是一種受量子力學(xué)支配的光化學(xué)性質(zhì)。然而,盡管熒光研究的歷史悠久,但沒有明確的指導(dǎo)方針來制造熒光分子,就像制造吸光分子一樣。
分子熒光發(fā)射的簡(jiǎn)化物理化學(xué)機(jī)制如下圖所示。最初,研究人員認(rèn)為分子處于單線態(tài)(S0)狀態(tài);在 S0 最小值時(shí),它吸收光并轉(zhuǎn)變?yōu)閱尉€態(tài)第一激發(fā)態(tài)(S1)。S1 激發(fā)分子在 S1 狀態(tài)下弛豫到最小值并回到 S0 狀態(tài),將 S1 和 S0 狀態(tài)之間的能量差作為光(熒光)發(fā)射。激發(fā)的分子應(yīng)該在 S1 狀態(tài)下移動(dòng)到最小值,以便在不失活的情況下發(fā)光。
一些因素,包括與氧分子的反應(yīng)、分子碰撞、分子內(nèi)/分子間電子轉(zhuǎn)移和聚集,可能會(huì)在分子在激發(fā)狀態(tài)下運(yùn)動(dòng)時(shí)使其失活;這導(dǎo)致很難將熒光與分子結(jié)構(gòu)相關(guān)聯(lián)。因此,自動(dòng)化熒光分子設(shè)計(jì)將是有幫助的。
圖示:熒光分子的單線態(tài)基(S0)態(tài)和單線態(tài)第一激發(fā)(S1)態(tài)的 PES 示意圖。(來源:論文)
近期,基于機(jī)器學(xué)習(xí)(ML)的從頭分子生成器(DNMG)已被開發(fā)用于設(shè)計(jì)具有簡(jiǎn)單和可預(yù)測(cè)值的分子,例如分配系數(shù)(logP)的對(duì)數(shù),可以從分子的組成部分估計(jì)。
將 DNMG 與經(jīng)典模擬相結(jié)合,成功地生成了具有改進(jìn)的多功能性和實(shí)用性的分子。例如,DNMG 和對(duì)接模擬的結(jié)合可用于設(shè)計(jì)生物活性分子;這是通過有機(jī)合成研究的。結(jié)合分子動(dòng)力學(xué)或預(yù)測(cè)模型,DNMG 還可以指導(dǎo)功能聚合物的合成。
在之前的研究中,研究人員將量子化學(xué)計(jì)算(QC)與 DNMG(稱為 ChemTS)相結(jié)合,它(原則上)可以從頭設(shè)計(jì)以量子力學(xué)(QM)特性為特征的功能分子。因此,ChemTS 與 QC 相結(jié)合被應(yīng)用于設(shè)計(jì)可以吸收具有所需波長(zhǎng)的光的分子。在 86 個(gè)設(shè)計(jì)和生成的分子中,選擇了 6 個(gè)未包含在訓(xùn)練數(shù)據(jù)集中的已知分子進(jìn)行紫外-可見 (UV-vis) 吸收測(cè)量。結(jié)果與發(fā)生器的目標(biāo)波長(zhǎng)一致。
此外,DNMG 增加了發(fā)現(xiàn)新分子的可能性,因?yàn)榕c傳統(tǒng)的高通量 QM 和使用 ML 模型篩選相比,DNMG 的搜索區(qū)域在數(shù)據(jù)集中不受限制。研究人員還使用 QC 對(duì) ChemTS 產(chǎn)生的分子進(jìn)行了官能團(tuán)富集分析,以最大化電子增益能量,并發(fā)現(xiàn)了駐極體文獻(xiàn)中未包含的重要官能團(tuán)。
圖示:在 B3LYP/3-21G* 水平上,生成分子的 S1 狀態(tài)吸收和熒光的 OS 分布曲線。(來源:論文)
雖然相對(duì)簡(jiǎn)單的特性,如光吸收和電子增益能量,可以直接與分子結(jié)構(gòu)相關(guān),但復(fù)雜的現(xiàn)象,如僅由特定分子表現(xiàn)出的熒光,難度要大得多。
在熒光的情況下,有必要考慮多種性質(zhì),這些性質(zhì)錯(cuò)綜復(fù)雜地交織在一起。這使得很難為分子結(jié)構(gòu)的設(shè)計(jì)建立直觀的指導(dǎo)方針。為了設(shè)計(jì)實(shí)用的化合物,控制目標(biāo)分子特性的復(fù)雜機(jī)制必須適當(dāng)?shù)財(cái)?shù)字化以用于 DNMG。此外,必須考慮計(jì)算成本隨著探索化學(xué)空間的機(jī)制復(fù)雜性的增加而增加。
圖示:使用 ChemTS 設(shè)計(jì)的未報(bào)告的熒光分子。(來源:論文)
在這項(xiàng)研究中,該團(tuán)隊(duì)設(shè)計(jì)了具有大規(guī)模并行化 ChemTS 版本的熒光分子。該程序包使用 QC 將熒光機(jī)制的最低要求數(shù)字化。有幾個(gè)基于電子結(jié)構(gòu)理論的用戶友好軟件包可用于分子和材料的 QC。
為了平衡可靠性與計(jì)算成本,研究人員使用密度泛函理論 (DFT) (29) 來評(píng)估勢(shì)能面 (PES)。為了解決廣泛探索化學(xué)空間的計(jì)算成本,用基于虛擬損失的概念對(duì) ChemTS 進(jìn)行大規(guī)模并行化;使用 1024 個(gè)核,生成了 3643 個(gè)分子。
為了驗(yàn)證,他們合成了一種未報(bào)告的化合物和幾種已報(bào)告的化合物。六種化合物,包括一種未報(bào)道的化合物,如預(yù)期的那樣發(fā)出熒光。未報(bào)道的分子可通過市售試劑之間的偶聯(lián)合成,具有意想不到的特性,盡管它由常見的片段[香豆素、吡啶和吡唑并嘧啶]組成。這表明大規(guī)模并行 DNMG 有可能引發(fā)分子設(shè)計(jì)的范式轉(zhuǎn)變。
圖示:PC的光致過程。(來源:論文)
討論
幾十年來,QC 在化學(xué)和材料科學(xué)中發(fā)揮了重要作用。在此期間,計(jì)算機(jī)輔助分子設(shè)計(jì)已被用于藥物發(fā)現(xiàn)。然而,QC 只專注于對(duì)實(shí)驗(yàn)結(jié)果的分析和推測(cè);很少考慮諸如預(yù)測(cè)各種現(xiàn)象和設(shè)計(jì)材料之類的創(chuàng)造性工作。
ML 算法最近在化學(xué)和材料科學(xué)中的應(yīng)用,代表了計(jì)算機(jī)輔助化學(xué)和材料科學(xué)的一個(gè)積極轉(zhuǎn)折點(diǎn)。為了自動(dòng)設(shè)計(jì)對(duì)有機(jī)電子有用的分子,將 QC 與 DNMG 相結(jié)合至關(guān)重要,因?yàn)樵诖祟悜?yīng)用中,量子力學(xué)不容忽視。然而,基于 QC 的 DNMG 的價(jià)值必須先得到證明,然后才能在實(shí)踐中采用。
在這項(xiàng)研究中,研究人員使用 DNMG 來創(chuàng)建具有目前無法輕易預(yù)測(cè)的特性的分子:熒光。他們使用 DFT 設(shè)計(jì)了熒光化合物,這是一種固有的量子力學(xué)方法。盡管眾所周知,分子受量子力學(xué)規(guī)則的支配,但僅憑 QC 很難從頭創(chuàng)建一個(gè)新分子。盡管熒光分子具有簡(jiǎn)單的 PES,但它們很難從第一原理設(shè)計(jì),因?yàn)樗鼈兊亩鄻有允沟脽晒馀c分子結(jié)構(gòu)的關(guān)聯(lián)變得非常困難。
圖示:PC的光化學(xué)性質(zhì)。(來源:論文)
然而,生成器處理了這種多樣性,并成功地從頭開始設(shè)計(jì)了熒光分子。基于 QC 的大量從頭計(jì)算需要大量并行計(jì)算(1024 核,5 天);盡管如此,生成器還是成功地產(chǎn)生了 3643 個(gè)候選分子。發(fā)生器產(chǎn)生吸收長(zhǎng)波長(zhǎng)光的分子,以類似于專業(yè)人士的方式控制分子的共軛長(zhǎng)度;然而,它無法找到分子的熒光波長(zhǎng)/強(qiáng)度與共軛長(zhǎng)度/芳環(huán)數(shù)之間的明確相關(guān)性。這表明從頭設(shè)計(jì)熒光分子的困難。
研究人員根據(jù)可合成性和可見熒光標(biāo)準(zhǔn),選擇了七種已知化合物進(jìn)行驗(yàn)證和一種候選化合物進(jìn)行進(jìn)一步研究。實(shí)驗(yàn)驗(yàn)證表明,DNMG 成功設(shè)計(jì)了 75%(八分之六)的熒光化合物。PC 的熒光(肉眼可見)證明了 DNMG 的創(chuàng)新潛力。
在設(shè)計(jì) PC 時(shí),生成器在香豆素中引入了一個(gè)不熟悉的基團(tuán)吡唑并嘧啶;這種連接引起了高空間排斥,但仍導(dǎo)致 OS 增加。
普通化學(xué)家很難想出一種通過增加片段之間的空間排斥來增強(qiáng)熒光及其強(qiáng)度的方法。這說明生成器是一種可以超越專業(yè)知識(shí)或直覺的工具。DNMG 有可能引發(fā)分子設(shè)計(jì)的范式轉(zhuǎn)變。
雖然這項(xiàng)工作中合成的分子的熒光旨在通過肉眼檢測(cè),但通過消除對(duì)原子類型的限制并延長(zhǎng)設(shè)計(jì)時(shí)間,將產(chǎn)生更多有趣的分子。
此外,通過包括分子的光誘導(dǎo)動(dòng)力學(xué),可以實(shí)現(xiàn)更好的分子設(shè)計(jì)。通過進(jìn)一步開發(fā) QC,可以設(shè)計(jì)出更復(fù)雜的功能分子。
因此,具有大規(guī)模并行計(jì)算的生成器將能夠創(chuàng)建具有多樣化和有趣功能的復(fù)雜分子,可能導(dǎo)致非常復(fù)雜的合成路線,這將增加最近開發(fā)的基于 ML 的規(guī)劃逆合成路線的要求。
開源地址:
https://github.com/tsudalab/GaussianRunPack
https://github.com/tsudalab/FL_ChemTS