簡介
為了提高藥物發(fā)現(xiàn)過程的效率,藥物化學(xué)家廣泛應(yīng)用化學(xué)基因組學(xué)原理來定制合成或篩選工作,從而使候選分子與其靶點相匹配。將化合物空間與靶標(biāo)空間相關(guān)聯(lián)已經(jīng)促進(jìn)了這一領(lǐng)域的許多研究,在目前的研究中,通過在大量的化學(xué)基因組學(xué)數(shù)據(jù)集中專門探索分子酸堿性質(zhì)對生物活性的影響來擴(kuò)展這些研究。此外,我們還通過研究篩選化合物(包括 "天然產(chǎn)品 "組)的酸堿性質(zhì)來補充這些分析。
分子中存在的酸性和堿性官能團(tuán)是化學(xué)基因組學(xué)中的一個重要因素,因為它們會強烈影響分子的理化性質(zhì),如親油性和水溶性,反過來,這些因素又會影響化合物在生物系統(tǒng)中的行為,即受體相互作用以及吸收、分布、代謝、排泄和毒理學(xué)(ADMET)。酸/堿性質(zhì)對ADMET特性影響的具體例子包括酸性化合物傾向于表現(xiàn)出更高的血漿蛋白結(jié)合力,從而影響分布容積,而堿性化合物則傾向于通過磷脂中毒和蛋白通道結(jié)合等機制表現(xiàn)出更大的毒性。
在配體的雜合性與分子量(MW)和分配系數(shù)(logP)等特性之間建立聯(lián)系時。更大和更親脂的分子有可能與不止一個靶點相互作用,電荷狀態(tài)也可能對非靶點選擇性起作用,因此,電離常數(shù)從根本上關(guān)系到化合物的行為方式及其整體的類藥物特性。此外,酸電離常數(shù)(pKa)值和電離狀態(tài)對藥物制劑有重要影響,尤其是在化合物需要在溶液中給藥的情況下。在影響水溶性的主要因素中,極性是一個關(guān)鍵參數(shù),但它需要與適當(dāng)?shù)挠H脂性相平衡,才能使分子穿過膜并與特定的大分子相互作用。受體相互作用同樣需要藥物官能團(tuán)與大分子結(jié)合部位的官能團(tuán)互補??傊姾蔂顟B(tài)和電離常數(shù)深深地影響藥物的性質(zhì),因此需要進(jìn)一步研究藥物的酸/堿特性。
為了更深入地了解藥物的酸堿性質(zhì),我們研究了已上市藥物的pKa分布。然而,這一項工作僅探討了當(dāng)代藥物,將其擴(kuò)展到更廣泛的化合物將是有益的。
本研究檢查藥物、對于藥物的化學(xué)基因組和篩選出的化合物的酸堿特征,對他們進(jìn)行三個層次的分析。通過化合物的統(tǒng)計以確定具有可電離官能團(tuán)的化合物,并將這些物質(zhì)分類??呻婋x化合物的pKa值以圖表的形式顯示,包括單一酸和單一堿化合物。總之,我們希望能夠就篩選化合物或研究化學(xué)品是否符合藥物的酸堿特性提出問題。該研究旨在提高我們對酸堿特征及其對生物活性的基本影響的認(rèn)識。
實驗部分
藥物數(shù)據(jù)集是來自新墨西哥大學(xué)(Albuquerque, NM, USA)的內(nèi)部收集。剔除了不含碳的化合物、含重金屬的化合物、鹽類、聚合物、混合物以及分子量(MW)大于1000Da的物質(zhì),剩下3766種化合物。這些化合物代表了歐洲、亞洲和美國已批準(zhǔn)使用的當(dāng)代臨床使用的單一物質(zhì)。
商用化合物數(shù)據(jù)庫選自ZINC數(shù)據(jù)庫,該數(shù)據(jù)庫包含超過107種商用化合物的信息。ZINC數(shù)據(jù)庫提供了從完整數(shù)據(jù)庫中根據(jù)計算性質(zhì)(如MW、logP、氫鍵供體/受體數(shù)量、可旋轉(zhuǎn)鍵的數(shù)量和PSA)推導(dǎo)的子集。
01
對以下ZINC子集進(jìn)行了檢測:
02
對于每個數(shù)據(jù)集,都遵循以下程序
結(jié)果與討論
生物活性化合物的電離狀態(tài)強烈影響其在生物系統(tǒng)中的行為--該化合物如何與目標(biāo)結(jié)合位點相互作用,或如何在水環(huán)境和脂質(zhì)環(huán)境之間分離?;衔锏膶嶋H電離狀態(tài)取決于局部環(huán)境的pH值,雖然通常接近中性(~7.4),但pH值范圍很廣。例如,在腸道內(nèi),pH值從1到8不等,而在配體結(jié)合位點的微環(huán)境中,官能團(tuán)的pKa可能會受到兩個單位或更多單位的干擾。因此,酸性和堿性行為的意義并不是簡單的電離狀態(tài)研究,它還必須包括藥物發(fā)現(xiàn)過程中遇到的一系列生物制藥情況。
當(dāng)代藥物
選擇經(jīng)過批準(zhǔn)的藥物數(shù)據(jù)集來代表當(dāng)代治療分子。這個精心策劃的數(shù)據(jù)集由美國、歐洲和亞洲監(jiān)管機構(gòu)批準(zhǔn)的藥物組成,從制藥和醫(yī)學(xué)的角度來看,可以被認(rèn)為是具有國際意義的。
在本研究中,我們對藥物數(shù)據(jù)集進(jìn)行了過濾,保留了所有含碳物質(zhì),并剔除了含有重金屬、鹽類、混合物、聚合物以及分子量>1000的化合物。預(yù)測了每個分子的pKa值,并將化合物分為電荷狀態(tài)類別:始終電離(6.3%)、中性(20.2%)、單酸(14.2%)、二酸(3.5%)、單堿(27.8%)、二堿(10.1%)、簡單兩元化合物(含有一種酸和一種堿的化合物;9.5%)和復(fù)雜化合物(8.4%;表1,圖1 a)。圖1b, c顯示了藥物數(shù)據(jù)集中單酸和單堿化合物的pKa分布。
左右滑動,查看更多
圖1.a) 獲準(zhǔn)用于人體(藥物)的小分子藥物的酸/堿類別細(xì)分。酸/堿類別包括始終離子化(pKa<0的酸、pKa>12的堿和帶永*久電荷的化合物)、中性化合物、單酸物質(zhì)、單堿物質(zhì)、含兩個酸性基團(tuán)的化合物、含兩個堿性基團(tuán)的化合物、簡單的兩性化合物(一個酸性基團(tuán)和一個堿性基團(tuán))以及其他酸性基團(tuán)和堿性基團(tuán)的復(fù)雜組合。含有b)單個酸性基團(tuán)和c)單個堿性基團(tuán)的化合物的pKa分布。pKa值被劃分為單個對數(shù)單位范圍。直方圖柱高表示為化合物總量的百分比。
最常見的酸性基團(tuán)是羧酸、雜環(huán)氮原子、羥肟酸、酚類和磺酰胺,共占酸性基團(tuán)的93.5%。出現(xiàn)頻率較低的酸是磷酸鹽、酰亞胺、硫酸鹽、碳酸、四唑、氨基甲酸酯、醇、酸性酰胺、酸性苯胺、酰肼和硫醇。最常見的堿性基團(tuán)是脂肪族胺、胍、脒、苯胺、堿性酰胺和雜環(huán)氮原子。
圖2和圖3顯示了屬于這些類別的藥物實例。有趣的是,超過60%的藥物只有一個或沒有可電離的官能團(tuán)。對含有一個堿性基團(tuán)的化合物的pKa值分布進(jìn)行回顧后發(fā)現(xiàn),pKa值低于6.0的單一堿很少(圖1 c)。對于單一含酸物質(zhì),pKa值在5-8范圍內(nèi)的酸性官能團(tuán)非常少(圖1b)。這與缺乏pKa值在此范圍內(nèi)的酸性官能團(tuán)有關(guān)--兩種最常見的酸性官能團(tuán)的典型pKa值分別為:羧酸鹽3.5-5,酚7.5-10.5。
表1.
化學(xué)基因組學(xué)和篩選化合物數(shù)據(jù)
集中化合物的電荷狀態(tài)類別。
01
化學(xué)基因組學(xué)和篩選化合物數(shù)據(jù)集
02
化學(xué)基因組數(shù)據(jù)集的酸堿特性
最后,我們比較了配體門控、電壓門控和其他離子通道(圖7)。這些化合物主要是單堿基或二堿基,但31%的電壓門控通道配體是中性的,23%的 "其他 "類化合物是單酸(主要是弱酸,如苯酚)。配體和電壓門控通道中pKa值高于7.0的堿性化合物比例分別為55.3%和64.4%,而 "其它 "離子通道中僅有14.4%的單堿基在此范圍內(nèi)。
化學(xué)基因組學(xué)旨在增加我們對小型有機化合物如何與生物系統(tǒng)相互作用和擾動生物系統(tǒng)的了解。如果能將這些知識轉(zhuǎn)化為用于篩選目的的定制化合物集,那么我們就能實現(xiàn)改進(jìn)藥物發(fā)現(xiàn)方法的目標(biāo)。從上面的分析可以清楚地看出,每一類配體都具有不同的酸堿分布。圖8顯示了已知靶標(biāo)家族的23個化學(xué)基因組學(xué)數(shù)據(jù)集的主成分分析(PCA)圖,采用化合物類別、兩性溶解物比例和pKa分布數(shù)據(jù)作為輸入數(shù)據(jù),揭示了靶標(biāo)家族的聚類。PCA的載荷(附錄1,Supping Information)顯示,PC1與堿基pKa分布數(shù)據(jù)以及普通兩性離子和齊聚兩性離子的比例相關(guān)。酸性化合物位于圖譜的上部區(qū)域。PC2與電荷狀態(tài)類別數(shù)據(jù)以及部分酸pKa分布數(shù)據(jù)相關(guān)聯(lián),堿性化合物位于左下象限。酸或堿基團(tuán)較少的化合物類別位于右下象限。
在該分析中,GPCR生物胺由于具有相似的單堿基pKa分布而靠近轉(zhuǎn)運體(主要是單胺轉(zhuǎn)運體配體)。配體門控離子通道和電壓門控離子通道也聚集在一起。PDE和激酶配體通常模擬嘌呤,這種分組反映了這些化合物的雜環(huán)性質(zhì)。GPCR前列腺素組、GPCR核苷酸組、整合素組、金屬蛋白酶組和核受體組與其他組分開,反映了特定功能基團(tuán)的高比例。例如,金屬蛋白酶配體含有可與活性金屬(如鋅)結(jié)合的特定官能團(tuán)(最常見的是羥肟酸)。與此類似,GPCR前列腺素配體也以羧酸為主。
More
左右滑動,查看更多
圖 5. a) 蛋白酶配體的電荷狀態(tài)類別概覽。含有b)單個酸性官能團(tuán)和c)單個堿性官能團(tuán)的化合物的pKa分布圖
03
篩選化合物的酸堿性質(zhì)
左右滑動,查看更多
圖 6. a) 激酶配體的電荷狀態(tài)類別概覽。含有b)單個酸性官能團(tuán)和c)單個堿性官能團(tuán)的化合物的pKa分布。
左右滑動,查看更多
圖 7. a) 離子通道配體的電荷狀態(tài)類別概覽。含有b)單個酸性官能團(tuán)和c)單個堿性官能團(tuán)的化合物的pKa分布圖
該分析表明,藥物和篩選數(shù)據(jù)集的酸堿構(gòu)成存在很大差異。我們有理由相信,這種差異主要是由篩選化合物的合成和供應(yīng)過程造成的。供應(yīng)商公司受制于化合物的合成可得性和成本。因此,化合物的理化性質(zhì)受到快速合成必要性的強烈影響。一項對醫(yī)藥化學(xué)家的研究發(fā)現(xiàn),他們傾向于制備可溶于有機溶劑的中性分子,并在純化過程中容易從有機溶劑中結(jié)晶出來。
高通量方法鼓勵減少合成步驟(即避免化學(xué)反應(yīng)性、可電離基團(tuán)的保護(hù)和去保護(hù))和易于純化的化合物(例如,眾所周知,在硅膠柱上難以純化的齊聚物)。包括穩(wěn)定性在內(nèi)的其他因素可能會減少某些官能團(tuán)的數(shù)量;例如,胺類化合物在儲存過程中容易氧化。考慮到這些因素,可以理解的是,篩選化合物中(a)中性化合物較多,(b)普通兩性化合物較多,(c)pKa<7的酸較少,(d)pKa>7的堿較少。一些化合物供應(yīng)商最近提供的產(chǎn)品開始包含更多種類的藥物化學(xué)家友好型物質(zhì),同時還出現(xiàn)了基于靶標(biāo)的產(chǎn)品系列。
天然產(chǎn)物歷來是藥物和藥物線索的重要來源,通常被認(rèn)為比純合成篩選的化合物更像藥物。一組天然產(chǎn)物的性質(zhì)與藥物相似,但它們具有更多的可旋轉(zhuǎn)鍵、立體中心和更高的分子量。盡管天然產(chǎn)物可能帶來任何優(yōu)勢,但由于處理這些化合物的復(fù)雜性,制藥行業(yè)已普遍減少在篩選中使用天然產(chǎn)物。在我們的分析中,我們發(fā)現(xiàn)天然產(chǎn)物組明顯不同于其他篩選化合物,它們具有藥物的某些特征。盡管ZINC天然產(chǎn)物集含有大量的中性化合物,但與篩選化合物相比,它還包括更高比例的復(fù)雜可電離化合物(始終電離、簡單和復(fù)雜化合物)以及更多的齊聚物化合物。與篩選化合物相比,單酸和單堿的pKa分布更接近于藥物??偟膩碚f,天然產(chǎn)物數(shù)據(jù)集不能被認(rèn)為與藥物的特征非常吻合,但它確實包含了藥物pKa分布的一些特征。該分析也可與Feher和Schmidt產(chǎn)生的數(shù)據(jù)一起使用,F(xiàn)eher和Schmidt研究了藥物、天然產(chǎn)物和組合化學(xué)化合物的各種理化性質(zhì)。
圖 8. 化學(xué)基因組學(xué)數(shù)據(jù)集的主成分(PC)1 和 2 的得分圖。主成分的載荷見 "輔助信息"。PC1 和 PC2 分別與堿和酸的 pKa 值相關(guān)。酸性基團(tuán)比例較高的數(shù)據(jù)集一般位于圖譜的右上方,而堿性化合物占多數(shù)的數(shù)據(jù)集則位于圖譜的左下方。
左右滑動,查看更多
圖 9. a) 藥物、化合物供應(yīng)商(Vendors-clean、供應(yīng)商-清潔線索)和天然產(chǎn)品數(shù)據(jù)集之間電荷態(tài)類別的差異對比。b) 含有單一酸性或單一堿性官能團(tuán)的化合物的 pKa 分布:藥物、化合物供應(yīng)商(Vendors-clean、供應(yīng)商-清潔線索)和天然產(chǎn)物數(shù)據(jù)集。
More
功能集團(tuán)
哪些官能團(tuán)對藥物和篩選化合物的酸堿性質(zhì)負(fù)責(zé)?表5和表6顯示了對藥物、化學(xué)基因組和篩選數(shù)據(jù)集的分析。表5和表6顯示,對于藥物來說,最主要的酸性基團(tuán)是羧酸(17%)、酚類(8%)、雜環(huán)(4%)和磺胺(3%),而最重要的堿是脂肪胺(29%)、雜環(huán)胺(28%)和苯胺(5%)。
化學(xué)基因組數(shù)據(jù)集揭示了酸堿特性的巨大多樣性,反映了結(jié)合位點對配體酸堿特性的影響。例如,整合素和GPCR類原生質(zhì)集之間具有極高比例的羧酸;GPCR核苷酸和激酶非酪氨酸集具有高比例的酸性雜環(huán)氮原子,而且引人注目的是,金屬蛋白酶集一半以上含有羥肟酸(表1)。最后,核受體數(shù)據(jù)集顯示酚酸的比例較高,而酚酸在很大程度上是雌激素配體。在所有這些情況中,特定官能團(tuán)的高比例可以通過考慮其大分子結(jié)合位點的性質(zhì)來合理解釋。例如,金屬蛋白酶組中羥肟酸的高比例與該基團(tuán)需要與酶內(nèi)的鋅原子結(jié)合有關(guān)。值得注意的是,相對于藥物數(shù)據(jù)集,供應(yīng)商篩選集合中的羧酸和酚類都很缺乏,分別只有~3%和2%。
對堿性基團(tuán)的分析也提供了配體與其結(jié)合位點之間的類似聯(lián)系。整合素配體具有較高比例的堿性脒基和胍基(表6)。絲氨酸蛋白酶數(shù)據(jù)集偏愛脒基,而半胱氨酸蛋白酶數(shù)據(jù)集富含苯胺基。酪氨酸激酶配體含有大量堿性雜環(huán)氮原子。有幾類配體含有較高比例的脂肪胺:GPCR胺、GPCR肽、GPCR A類其它和轉(zhuǎn)運體。在后一種情況下,這些大分子的天然配體的基團(tuán)與化學(xué)基因組中的脂肪胺之間存在著明顯的聯(lián)系。在藥物組和篩選組中,含有脂肪族胺的化合物比例再次出現(xiàn)明顯差異,分別為29%和2%。
結(jié)果與討論
生物活性化合物的電離狀態(tài)強烈影響其在生物系統(tǒng)中的行為--該化合物如何與目標(biāo)結(jié)合位點相互作用,或如何在水環(huán)境和脂質(zhì)環(huán)境之間分離。化合物的實際電離狀態(tài)取決于局部環(huán)境的pH值,雖然通常接近中性(~7.4),但pH值范圍很廣。例如,在腸道內(nèi),pH值從1到8不等,而在配體結(jié)合位點的微環(huán)境中,官能團(tuán)的pKa可能會受到兩個單位或更多單位的干擾。因此,酸性和堿性行為的意義并不是簡單的電離狀態(tài)研究,它還必須包括藥物發(fā)現(xiàn)過程中遇到的一系列生物制藥情況。
結(jié)論
藥物的酸性和堿性基團(tuán)是大部分藥物/受體相互作用的主要識別元素。在化學(xué)基因組類別中觀察到的特定酸性和堿性官能團(tuán)的聚集就證明了這一點,例如在GPCR類前列腺素配體中羧酸基團(tuán)占優(yōu)勢。
配體與其結(jié)合位點之間的酸堿互補性在很大程度上決定了藥物設(shè)計者所期望的親和力。配體的酸堿性質(zhì)也是親脂性的基本決定因素,親脂性對生物制藥性質(zhì)(ADMET)和非靶標(biāo)活性都有很大影響。藥物設(shè)計者還需要注意強離子化化合物可能會導(dǎo)致以下開發(fā)問題:吸收和分布不良、血漿蛋白結(jié)合力過高、hERG通道親和力明顯、磷脂中毒和制劑前景不佳。酸/堿特性也深深影響著制劑考慮因素和化學(xué)穩(wěn)定性。因此,在藥物發(fā)現(xiàn)領(lǐng)域進(jìn)一步了解電荷狀態(tài)和pKa值有可能提高效率。
本研究的主要重點是比較藥物、化學(xué)基因組學(xué)數(shù)據(jù)集和篩選化合物的酸堿特征。具體來說,我們詳細(xì)描述了電荷狀態(tài)類別、單酸和單堿化合物的pKa分布、普通和齊聚物的比例,并確定了每個數(shù)據(jù)集的可電離官能團(tuán)。我們發(fā)現(xiàn)藥物和篩選化合物的特征存在差異,例如,在篩選化合物集中pKa值高于7.0的堿性化合物很少。此外,中性化合物在篩選化合物集中占主導(dǎo)地位,其數(shù)量是藥物數(shù)據(jù)集的兩倍。由于藥物發(fā)現(xiàn)是以靶點為導(dǎo)向的,我們還研究了23個化學(xué)基因組學(xué)數(shù)據(jù)集,以提供這些蛋白質(zhì)家族的酸堿概況。這些數(shù)據(jù)集顯示了酸/堿譜的巨大多樣性,反映了其結(jié)合位點的要求。這項工作是在我們以前研究藥物pKa譜的基礎(chǔ)上進(jìn)行的。
鑒于酸堿性質(zhì)對藥物行為的深刻影響,在藥物發(fā)現(xiàn)過程中考慮電荷狀態(tài)和pKa值具有深遠(yuǎn)的意義。特別是,篩選化合物的選擇非常重要,因為它們的選擇會影響命中率效率和后續(xù)的優(yōu)化過程。在選擇化合物之前對其進(jìn)行過濾的目的是避免將不適合測試或進(jìn)一步化學(xué)處理的分子納入其中?;衔锖Y選通??紤]化合物的理化性質(zhì)、結(jié)構(gòu)多樣性、毒性或其他不受歡迎的官能團(tuán)。盡管人們意識到要平衡酸堿的比例,但在篩選化合物時對pKa分布的考慮卻較少關(guān)注。例如,阿斯利康公司用于基于片段篩選的兩個文庫。這兩個文庫被選擇為包含1:1:4的陽離子/陰離子/中性比例,以中性化合物為主。在pH值為7.0的條件下,我們的藥物數(shù)據(jù)集的酸性定義為pKa低于7.0,堿性定義為pKa高于7.0,結(jié)果陽離子/陰離子/中性的比例為2:1:2.5。
我們認(rèn)為在篩選化合物時需要考慮pKa分布以及酸性和堿性官能團(tuán)的多樣性。如果不注意這一點,那么化合物將反映供應(yīng)商數(shù)據(jù)庫的酸堿特征,并將明顯偏離藥物特征,或者更重要的是,偏離特定化學(xué)基因組家族的一般需求??梢哉f,通過模仿已知藥物和靶點的特征,發(fā)現(xiàn)將偏向于以前探索過的化學(xué)生物學(xué)。然而,通過在篩選方案中加入特定的酸/堿信息,而不是僅僅使用簡單的性質(zhì)篩選,有可能選擇出成功概率更大的化合物,從而提高化學(xué)基因組初篩的成功率。
我們進(jìn)行這項研究的主要目的是提供信息,擴(kuò)大藥物設(shè)計者考慮的理化性質(zhì)的廣度。我們認(rèn)為這將有助于篩選出高質(zhì)量的化合物,并突出酸堿性質(zhì)在藥物開發(fā)中的普遍影響。
而對于生物活性物質(zhì)以及設(shè)計出的新藥的pKa,在數(shù)據(jù)庫中不能找到類似數(shù)據(jù)的情況下,需要我們對它們的pKa進(jìn)行準(zhǔn)確的測量來評估其在生物體內(nèi)的ADMET。基于這個目的下,銳拓重磅打造,歷時24個月研制的NCE P3 能完美解決這一問題。
物化參數(shù)分析儀
NCE P3
點擊視頻了解
通過對藥物進(jìn)行酸堿滴定,對滴定過程中溶液pH以及光譜的變化進(jìn)行檢測確定滴定終點,在計算機模型的輔助計算下得到樣品的pKa,利用藥物的酸堿性質(zhì)確定pKa的大小,能保證測量結(jié)果的準(zhǔn)確性,因為在利用計算機預(yù)測pKa時,對于新型化合物基團(tuán)以及基團(tuán)間的相互影響不能進(jìn)行全面考慮,并且在藥物給藥后,體內(nèi)pH值的變化會影響藥物的pKa。這對藥物的pKa預(yù)測帶來一定誤差,影響藥物的后期開發(fā)。因此利用藥物的酸堿滴定,以酸堿滴定結(jié)果得到真實的pKa結(jié)果,并且在滴定過程中,我們可以改變?nèi)軇㏄H來模仿藥物進(jìn)入體內(nèi)后的不同pH值的環(huán)境,這能更好反映藥物的實際理化情況。為此NCE P3能預(yù)先設(shè)計不同的pH環(huán)境,更好的準(zhǔn)確檢測藥物的pKa,這能很好的滿足對藥物pKa的檢測,準(zhǔn)確預(yù)測藥物在體內(nèi)的理化性質(zhì)。
物化參數(shù)分析儀
NCE P3
孔小樂
銳拓儀器首席科學(xué)家
2023年7月25日
19:30-20:30
銳拓儀器首席科學(xué)家孔小樂博士將以線上直播課形式為大家?guī)碇匕跽n程《pKa對藥物研發(fā)的重要性》,歡迎大家掃碼預(yù)約。
掃碼預(yù)約直播課
讓科學(xué)實驗更輕松
Make Scientific Experiments Easier
銳拓
銳拓公眾號
關(guān)注我們 了解更多
歡迎您關(guān)注我們的微信公眾號了解更多信息
電話
微信掃一掃