高通量蛋白質(zhì)組學(xué)平臺(tái)somalogic和olink是兩個(gè)基于親和力的高通量蛋白質(zhì)組學(xué)研究平臺(tái),它們通過(guò)對(duì)結(jié)合靶蛋白進(jìn)行測(cè)量,在血漿蛋白等數(shù)千種蛋白質(zhì)的測(cè)量方面具有重要作用,有助于理解基因組與疾病之間的關(guān)系。somalogic的平臺(tái)使用單個(gè)適體來(lái)測(cè)量目標(biāo)蛋白,而olink的平臺(tái)則需要結(jié)合兩種不同抗體進(jìn)行免疫分析,這兩個(gè)平臺(tái)在測(cè)量蛋白質(zhì)方面具有一定的差異,也是近年來(lái)科學(xué)家們關(guān)注的重點(diǎn)問(wèn)題。
近日,來(lái)自decode genetics /安進(jìn)公司和冰島大學(xué)的kari stefansson團(tuán)隊(duì)在國(guó)際頂刊《nature》上在線發(fā)表了題為“l(fā)arge-scale plasma proteomics comparisons through genetics and disease associations”的研究性論文(圖1)。
在這項(xiàng)研究中,他們比較了基于olink explore 3072平臺(tái)和somascan v4平臺(tái)的數(shù)據(jù),分析了由英國(guó)生物銀行(ukb)和冰島生成的血漿樣本數(shù)據(jù),并使用可用基因型和表型數(shù)據(jù)來(lái)比較它們與平臺(tái)上蛋白質(zhì)水平的關(guān)聯(lián),發(fā)現(xiàn)選擇不同的平臺(tái)在疾病研究的背景下會(huì)對(duì)結(jié)果和結(jié)論產(chǎn)生實(shí)質(zhì)性的影響。這項(xiàng)研究深入理解了somalogic和olink平臺(tái)在高通量蛋白質(zhì)組學(xué)研究中發(fā)揮的重要作用,加深了對(duì)序列變異與疾病和其他性狀之間關(guān)系的理解。
圖1
通過(guò)對(duì)olink explore 3072中的1474個(gè)樣本和somascan v4中的419個(gè)樣本進(jìn)行重復(fù)測(cè)量,研究人員發(fā)現(xiàn),olink平臺(tái)的中位cv比低于somascan平臺(tái)(分別為0.35和0.50),這表明olink平臺(tái)的測(cè)定更加精確。這與之前的研究結(jié)果相反,之前的研究發(fā)現(xiàn)對(duì)照樣品的somascan測(cè)定的cv值低于olink測(cè)定的cv值。這表明對(duì)照樣品的cv值并不一定反映測(cè)定的精度,而cv比率則更準(zhǔn)確。
圖2
根據(jù)somascan和olink兩個(gè)平臺(tái)的研究結(jié)果,研究人員發(fā)現(xiàn)兩個(gè)平臺(tái)之間的水平相關(guān)性為0.33,分布呈現(xiàn)兩種模式,一種略高于0,另一種略低于0.6(圖2)。olink平臺(tái)由早期版本1536和附加后續(xù)檢測(cè)集expansion組成,其中1536組的中位數(shù)相關(guān)性顯著高于擴(kuò)展組,分別為0.36和0.27。相比之下,兩個(gè)平臺(tái)上所有可能檢測(cè)到的中位數(shù)相關(guān)性為-0.01,olink平臺(tái)內(nèi)的中位數(shù)相關(guān)性為0.08,somascan平臺(tái)內(nèi)的中位數(shù)相關(guān)性為-0.01。在兩個(gè)平臺(tái)上檢測(cè)到的cis pqtls分析中,蛋白質(zhì)水平的總體方差更為一致,但單個(gè)平臺(tái)上是否存在cis pqtls沒(méi)有顯示出明顯的趨勢(shì)。
olink和somascan平臺(tái)在檢測(cè)血漿蛋白質(zhì)時(shí),顯示出不同稀釋組間的蛋白質(zhì)豐度和相關(guān)性差異,且大部分蛋白質(zhì)水平低于檢測(cè)限。兩個(gè)平臺(tái)都缺乏細(xì)胞內(nèi)蛋白而富含分泌蛋白。組織之間的蛋白質(zhì)水平相關(guān)性差異較大,且與測(cè)量精度相關(guān)。樣本年齡、性別和bmi與許多蛋白質(zhì)水平顯著相關(guān),且兩個(gè)平臺(tái)在某些疾病中蛋白質(zhì)關(guān)聯(lián)結(jié)果一致,但也有不一致的結(jié)果,這可能與不同平臺(tái)間的測(cè)量差異和可能存在的不同蛋白質(zhì)形態(tài)有關(guān)。
在pqtl分析中,研究人員使用更多序列變體和數(shù)據(jù)歸一化方法,鑒定了大量順式和反式pqtl。在olink和somascan數(shù)據(jù)中,超過(guò)98%的順式pqtl僅與一種蛋白質(zhì)相關(guān),但少數(shù)pqtl與多個(gè)蛋白質(zhì)相關(guān)。研究人員還注意到在rna水平上存在cis基因表達(dá)的共同調(diào)控,但不影響pqtl檢測(cè)性能。他們還發(fā)現(xiàn)特定蛋白質(zhì)的cis pqtl檢測(cè)與高于lod的測(cè)定分?jǐn)?shù)和高于lod的中位數(shù)歸一化蛋白表達(dá)值呈正相關(guān),但這并不意味著低于lod的測(cè)量值不能提供信息。
研究人員還對(duì)不同祖先群體進(jìn)行pqtl分析,評(píng)估了更大的序列多樣性和ld的可變模式,將關(guān)聯(lián)信號(hào)細(xì)化到更少的變體。他們分別使用olink explore 1536平臺(tái)和somascan平臺(tái)對(duì)非洲人血漿中的1472種蛋白質(zhì)水平進(jìn)行分析,并檢測(cè)了順式pqtl。發(fā)現(xiàn)不同祖先群體之間存在pqtl的差異,非洲血統(tǒng)的測(cè)試者中較為常見(jiàn)與低水平的低密度脂蛋白膽固醇相關(guān)的pcsk9功能缺失變體,研究人員還發(fā)現(xiàn)了與血紅蛋白β亞基編碼基因hbb中的鐮狀細(xì)胞貧血變體相關(guān)的高水平hmox1。ukb-af組的順式pqtl具有較高的ld和平均變異數(shù)較少,與非洲血統(tǒng)人群具有更高的序列多樣性和較低的ld相一致(圖3)。在共有的893個(gè)蛋白中,有62個(gè)蛋白在ukb-af中實(shí)現(xiàn)了順式pqtl位點(diǎn)的大量改進(jìn),暗示在非洲血統(tǒng)人群中研究與相同變體的疾病相關(guān)性可能會(huì)獲得潛在收益。這些結(jié)果表明不同祖先群體之間存在pqtl的差異,并對(duì)疾病相關(guān)性研究具有潛在價(jià)值。
圖3
研究人員還發(fā)現(xiàn)olink和somascan兩個(gè)平臺(tái)檢測(cè)到的蛋白質(zhì)數(shù)量相差不大,且大部分蛋白質(zhì)都有cis pqtl存在。然而,兩個(gè)平臺(tái)檢測(cè)到的pqtl主要是trans pqtl,且反式的pqtl關(guān)聯(lián)多于順式,但順式的次要關(guān)聯(lián)多于反式。他們探討了順式pqtl的檢測(cè)比例受多種因素影響,包括稀釋組、亞細(xì)胞位置和cv比。此外,蛋白質(zhì)的豐富程度和檢測(cè)精度也會(huì)影響順式pqtl的檢測(cè)比例。在分析儀器匹配的蛋白質(zhì)方面,olink平臺(tái)比somascan平臺(tái)的獨(dú)聯(lián)體pqtl檢測(cè)比例更高,而olink和somascan平臺(tái)之間的相關(guān)性也較高(r = 0.48),但低于cis pqtl的相關(guān)性(r = 0.17)。最后,研究人員通過(guò)全基因組測(cè)序的數(shù)據(jù),發(fā)現(xiàn)了與罕見(jiàn)序列變異相關(guān)的蛋白質(zhì)水平在兩個(gè)平臺(tái)上的差異。
研究人員深入探索了olink和somascan兩個(gè)平臺(tái)檢測(cè)的pqtl之間的關(guān)聯(lián)性和差異。他們發(fā)現(xiàn)雖然兩個(gè)平臺(tái)對(duì)pav引起的表位效應(yīng)同樣敏感,但當(dāng)一個(gè)平臺(tái)的pqtl在另一個(gè)平臺(tái)沒(méi)有找到相應(yīng)的pqtl時(shí),或者兩個(gè)平臺(tái)的pqtl處于高ld時(shí),它們之間的相關(guān)性較低。此外,研究人員還指出了即使在兩個(gè)平臺(tái)上都檢測(cè)到一種蛋白質(zhì)的pqtl,也不能輕易地認(rèn)為它們玩全相同,因?yàn)樗鼈兛赡苁艿讲煌募夹g(shù)、樣本、數(shù)據(jù)質(zhì)量等因素的影響。此外,一些在somascan數(shù)據(jù)中與多個(gè)蛋白質(zhì)相關(guān)的pqtl在olink數(shù)據(jù)中并不與任何蛋白質(zhì)相關(guān),反之亦然。盡管兩個(gè)平臺(tái)上都檢測(cè)到了多效性pqtl,但它們并不玩全相同??偟膩?lái)說(shuō),盡管在兩個(gè)平臺(tái)上都檢測(cè)到多種蛋白質(zhì)的pqtl,但它們之間的關(guān)聯(lián)性和差異需要謹(jǐn)慎地考慮。
因此,研究使用了三種方法來(lái)建立這種關(guān)系:一種是分析pqtl和疾病相關(guān)變異之間的高ld(連鎖不平衡),另一種是將疾病相關(guān)變異包含在具有pqtl的高ld的可信基因集合中,蕞后一種是對(duì)于具有必要統(tǒng)計(jì)數(shù)據(jù)的特定示例,進(jìn)行統(tǒng)計(jì)共定位分析。在olink-ukb-bi和冰島的somascan兩個(gè)數(shù)據(jù)集中,都分別檢測(cè)到了大量的順式和反式pqtl,并且一些疾病相關(guān)的變異被發(fā)現(xiàn)在可信基因集合中。此外,研究人員還發(fā)現(xiàn)了一些具有疾病相關(guān)變異的高ld的順式pqtl,例如在il10位點(diǎn),rs3024493的次要等位基因(a)與其相關(guān)的rs3024505與ibd34的風(fēng)險(xiǎn)增加相關(guān)(圖4)。這個(gè)變異與較低的il-10水平相關(guān),而il-10被認(rèn)為是該區(qū)域蕞有可能的候選基因。總的來(lái)說(shuō),這些研究結(jié)果有助于更好地理解疾病相關(guān)變異與蛋白質(zhì)水平變化之間的聯(lián)系,以及這種聯(lián)系可以更好的預(yù)測(cè)疾病風(fēng)險(xiǎn)。
圖4
此外,研究人員還對(duì)腫瘤壞死因子配體超家族成員11 (tnfsf11)、erbb4、grp和il2rb的順式pqtl與一些疾病相關(guān)性進(jìn)行了研究。這些變異與原發(fā)性膽汁性肝硬化、較低的bmi和2型糖尿病風(fēng)險(xiǎn)、哮喘風(fēng)險(xiǎn)等有關(guān)。此外,他們還討論了在兩個(gè)平臺(tái)上檢測(cè)到的順式pqtl與疾病相關(guān)變異高ld的情況,并解釋了反式pqtl與疾病關(guān)聯(lián)的可能機(jī)制。
研究人員還發(fā)現(xiàn)反式pqtl通常與受疾病影響的組織中表達(dá)豐富的蛋白質(zhì)相關(guān),這些發(fā)現(xiàn)可能指向潛在的疾病生物標(biāo)志物。例如,defb4a和prss2的水平在兩個(gè)平臺(tái)之間高度相關(guān),而且在兩個(gè)平臺(tái)上都觀察到cis pqtl。為了評(píng)估哪些與疾病相關(guān)的反式pqtl可能對(duì)應(yīng)于同一途徑中蛋白質(zhì)之間的相互作用,他們根據(jù)string數(shù)據(jù)庫(kù)評(píng)估了受反式pqtl影響的每個(gè)蛋白質(zhì)是否與蕞接近變體的基因編碼的蛋白質(zhì)相互作用。對(duì)于具有疾病或性狀相關(guān)變異的高ld中約9%的反式pqtl,已知這兩種蛋白之間高度相互作用。例如,tlr3的變異與自身免疫性甲狀腺疾病和ifnl1的反式水平相關(guān),帶有ifnl1的反式pqtl強(qiáng)烈支持tlr3在自身免疫性甲狀腺疾病發(fā)病機(jī)制中的變異位點(diǎn)的作用。因此,這項(xiàng)研究的結(jié)果支持通過(guò)反式pqtl來(lái)研究潛在的疾病生物標(biāo)志物和藥物靶點(diǎn),以幫助更好地了解和治療疾病。
總結(jié)
這項(xiàng)研究通過(guò)比較了olink explore 3072和somascan v4平臺(tái)的數(shù)據(jù),研究人員發(fā)現(xiàn)兩個(gè)平臺(tái)之間存在適度的相關(guān)性。盡管兩個(gè)平臺(tái)上檢測(cè)到的順式蛋白數(shù)量性狀位點(diǎn)的決對(duì)數(shù)量相似,但olink平臺(tái)在此類(lèi)分析性能支持證據(jù)的比例上更高。此外,許多蛋白質(zhì)在不同平臺(tái)之間具有基因組關(guān)聯(lián)。因此,選擇合適的平臺(tái)對(duì)于蛋白質(zhì)與疾病研究的結(jié)果和結(jié)論具有重要影響。這些平臺(tái)提供的信息具有互補(bǔ)性,有助于研究人員更好地理解蛋白質(zhì)與疾病之間的關(guān)系。
以上文章來(lái)源于being科學(xué),作者鳶尾與半夏