轉(zhuǎn)座子(Transposable Elements,TEs),又稱轉(zhuǎn)座元件,指在基因組中能夠移動(dòng)或復(fù)制,并可以整合到基因組新位點(diǎn)的一段DNA序列??勺兗艚樱ˋlternative Splicing,AS),又稱選擇性剪接,是指從一個(gè)mRNA前體中通過不同的剪接方式產(chǎn)生不同的mRNA剪接異構(gòu)體的過程??勺兗艚釉谡婧松镏袕V泛存在,為蛋白質(zhì)組提供了多樣性。可變剪接以不同的方式增強(qiáng)蛋白質(zhì)的多樣性,包括通過轉(zhuǎn)座子的外顯子化。最近的轉(zhuǎn)錄組學(xué)分析確定了數(shù)千個(gè)具有外顯子化轉(zhuǎn)座元件的未注釋剪接轉(zhuǎn)錄本,但它們對(duì)蛋白質(zhì)組和生物學(xué)相關(guān)性的貢獻(xiàn)仍不清楚。
2024年12月26日,巴黎文理研究大學(xué)-居里夫人研究所Sebastian Amigorena科研團(tuán)隊(duì)在Cell期刊發(fā)表了文章“Transposable element exonization generates a reservoir of evolving and functional protein isoforms."該研究揭示了通過未注釋剪接事件的轉(zhuǎn)座子外顯子化產(chǎn)生穩(wěn)定的蛋白亞型,其具有特殊的功能和生物學(xué)意義,而且所獲得的功能受進(jìn)化選擇的影響。
研究背景
蛋白質(zhì)基因組學(xué)的進(jìn)展促進(jìn)了新蛋白質(zhì)的發(fā)現(xiàn)。來自非基因區(qū)域的開放閱讀框(ORFs)也可能編碼微蛋白或短ORF。潛在剪接位點(diǎn)通過隨機(jī)突變出現(xiàn)在基因附近,為通過剪接機(jī)制產(chǎn)生新的外顯子和轉(zhuǎn)錄本提供了進(jìn)化機(jī)會(huì)。如果它們?cè)谶M(jìn)化上是有優(yōu)勢的,那么這些新出現(xiàn)的剪接位點(diǎn)就可以固定在種群中,成為優(yōu)勢的甚至是構(gòu)成型的剪接異構(gòu)體。
研究發(fā)現(xiàn),最近獲得的剪接信號(hào)有很大一部分是位于內(nèi)含子區(qū)域的轉(zhuǎn)座子。轉(zhuǎn)座子覆蓋了45%的基因組區(qū)域,且可移動(dòng),這提供了一個(gè)受進(jìn)化作用影響的多態(tài)性位點(diǎn)儲(chǔ)庫。哺乳動(dòng)物TEs主要分為四類,包括DNA轉(zhuǎn)座子、短分散核元件(SINEs)、長分散核元件(LINEs)和長末端重復(fù)序列(LTRs)。TE對(duì)人類蛋白質(zhì)組的貢獻(xiàn)一直是一個(gè)有爭議的問題。基于外顯子和TEs(JETs)之間未注釋的剪接連接檢測,在癌癥和健康組織樣本中進(jìn)行了新生TE外顯子化研究。大多數(shù)JETs具有樣本特異性,只有很少部分在個(gè)體間共有。一些JETs只在腫瘤中檢測到,很少在健康組織樣本中觀察到。雖然,未注釋的剪接轉(zhuǎn)錄本在一定程度上在個(gè)體間復(fù)發(fā),并產(chǎn)生MHC I類多肽,但它們?nèi)匀豢赡艽韺?dǎo)致蛋白質(zhì)快速降解的“隨機(jī)錯(cuò)誤"。此外,未注釋的剪接異構(gòu)體可能代表一種“多樣性庫",在自然選擇壓力下進(jìn)化,并編碼穩(wěn)定的蛋白亞型,從而影響細(xì)胞功能。為了驗(yàn)證這一假設(shè),于是作者設(shè)計(jì)并開展了一系列的研究。
研究結(jié)果
首先,作者通過分析TCGA和CCLE數(shù)據(jù)集,發(fā)現(xiàn)一些JET在不同個(gè)體之間重復(fù)出現(xiàn),并呈現(xiàn)組織依賴性表達(dá)。隨后,又分析了JET剪接位點(diǎn)的年齡和保守性,發(fā)現(xiàn)它們相對(duì)較年輕,但重復(fù)性高的JET剪接位點(diǎn)相對(duì)更保守。隨著JET剪接位點(diǎn)年齡的增加,使用頻繁也會(huì)增加。
圖1. JETs可復(fù)發(fā),并呈組織依賴性表達(dá)
然后,通過轉(zhuǎn)錄組組裝、Ribo-seq和蛋白質(zhì)組學(xué)分析,鑒定了5種人類細(xì)胞系中存在的由mRNA剪接產(chǎn)生的1,227個(gè)未注釋的JET-ORFs,對(duì)應(yīng)了807個(gè)翻譯JETs。這些異構(gòu)體表達(dá)水平較低,但是能夠被有效地翻譯成蛋白質(zhì)。
圖2. 復(fù)發(fā)性JET可以被翻譯,并編碼成未注釋的蛋白亞型
通過預(yù)測不穩(wěn)定指數(shù)和實(shí)驗(yàn)驗(yàn)證,發(fā)現(xiàn)JET外顯子化異構(gòu)體相對(duì)穩(wěn)定。共聚焦顯微鏡分析顯示,這些異構(gòu)體可以定位到不同的亞細(xì)胞區(qū)域,包括細(xì)胞核、內(nèi)質(zhì)網(wǎng)和質(zhì)膜。通過過表達(dá)實(shí)驗(yàn)和單細(xì)胞克隆分析,發(fā)現(xiàn)JET外顯子化異構(gòu)體具有生物學(xué)功能,并與典型的已注釋異構(gòu)體(CAN)表現(xiàn)出不同的功能。
圖3. JET-ORFs具有功能性,且與CAN亞型相比可能具有不同的功能
之后,分析JET外顯子化異構(gòu)體中TE的類型和位置,發(fā)現(xiàn)顯著富集的TE類型是LINE,其次是SINE,再者是LTR,并且TE主要位于內(nèi)含子中。這些異構(gòu)體主要來自于古老基因,并且TE序列相對(duì)較年輕。
通過結(jié)構(gòu)預(yù)測和比較分析,發(fā)現(xiàn)TE外顯子化異構(gòu)體可以增加宿主蛋白的α螺旋含量,并改變宿主蛋白的二級(jí)結(jié)構(gòu)。這種變化可能與宿主基因的年齡有關(guān),古老基因編碼的蛋白質(zhì)中α螺旋含量更高。這表明JET外顯子化異構(gòu)體可能影響了宿主蛋白二級(jí)結(jié)構(gòu)。
圖4. JET-ORFs通過α螺旋含量影響宿主蛋白的二級(jí)結(jié)構(gòu)
主要技術(shù)
JET識(shí)別、轉(zhuǎn)錄組組裝、Ribo-seq分析、蛋白質(zhì)組學(xué)分析、蛋白質(zhì)穩(wěn)定性測定、亞細(xì)胞定位分析、結(jié)構(gòu)分析等。
本文小結(jié)
該文章主要研究了TE外顯化,這些TE外顯化亞型雖然表達(dá)量較低,但與經(jīng)典蛋白質(zhì)亞型一樣穩(wěn)定,并定位于不同的細(xì)胞器。它們擁有與經(jīng)典蛋白質(zhì)亞型不同的功能,例如調(diào)節(jié)基因表達(dá)、影響細(xì)胞增殖等。這些TE外顯化亞型往往來自于古老基因,并且具有更年輕的TE序列,這表明它們可能在蛋白質(zhì)進(jìn)化中發(fā)揮作用。該研究強(qiáng)調(diào)了TE外顯化在蛋白質(zhì)多樣性增加和功能演化中的重要作用。
參考文獻(xiàn)
Arribas Yago A., Baudon Blandine , Rotival Maxime, et al. Transposable element exonization generates a reservoir of evolving and functional protein isoforms. Cell, 187, 7603-7620.