標題摘要內容

 技術前沿 

關于我們/About??
通過轉錄組數據挖掘與腫瘤免疫微環境相關分子標記物
來源: | 作者:geneseed | 發布時間: 2020-06-01 | 388 次瀏覽 | 分享到:

腫瘤微環境 (tumor microenvironment,TME) 是腫瘤細胞賴以生存和發展的復雜內部環境,TME是一個復雜的生態系統,并且在腫瘤發生的所有階段都發揮著重要作用。TME由癌細胞,與癌癥相關的成纖維細胞(CAF),內皮細胞,免疫細胞,細胞外基質(ECM),微血管和浸潤的生物分子組成。其中,腫瘤微環境內的免疫細胞及其調節方式對腫瘤的發生和發展起著重要的作用,腫瘤微環境免疫特征已經被列入腫瘤十大特征之一,其一方面能夠在預測患者臨床預后中發揮作用;另一方面,還能預測患者臨床化療或者放療等的臨床療效。如今,癌癥免疫療法開啟了腫瘤治療的新潮流并取得了驚人的成績,但是,大約只有三分之一的患者受益于抗CTLA4,抗PD-1和抗PD-L1抗體在內的免疫檢查點抑制劑(ICI)治療。如何應對分子靶向藥物耐藥或者療效不佳成為了廣大研究者的新挑戰。因此,分析腫瘤微環境中免疫細胞的種類和分布等,具有重要的臨床意義。


腫瘤免疫微環境分子標記物挖掘離不開生物信息技術的迅速發展,目前,科學家已經開發了許多生物信息學工具來尋找生物標志物。比如,加權基因共表達網絡分析(WGCNA)算法已被廣泛用于在轉錄水平上尋找生物標記,可用于挖掘基因之間的相關模式,以識別癌癥的相關模塊和核心基因,是一種有效的工具。CIBERSORT算法通過估計RNA轉錄本的相對子集進行細胞類型鑒定,該工具使用解卷積算法來量化免疫細胞的細胞組成,是另一種用于分析基因表達數據的生物信息學工具。


在臨床科研中,我們結合TCGA和GEO在線數據庫中的腫瘤表達譜數據進行免疫浸潤分析,對研究問題的解讀和濕實驗的指導,可起到事半功倍的作用。目前國際上也發表了不少這方面以生信分析為主濕實驗為輔的研究論文。下面我們以近期在Aging (Albany NY)雜志(影響因子:5.515分)發表的一篇文章為例,給大家展示從轉錄組數據挖掘與腫瘤免疫微環境相關分子標記物的分析思路。


該研究的對象鎖定為透明細胞腎細胞癌(ccRCC),腎細胞癌(RCC)是最常見的惡性腫瘤之一,RCC占所有腎癌的80%,而透明細胞腎細胞癌是最常見的腎細胞癌亞型。近年來,免疫檢查點抑制劑已成為腎細胞癌一線治療的標準。但是,尚無用于腎細胞癌免疫治療的特異性分子標記。因此,探索免疫相關分子標志物是腎細胞癌研究的核心重點。RCC易于發生免疫浸潤,并且腫瘤微環境的特征強烈改變了對免疫治療的反應。CD8 + T細胞有助于腫瘤適應性免疫。在ccRCC免疫細胞中,CD8 + T細胞占最大比例。在大多數實體瘤中,高度浸潤的CD8 + T細胞有利于腫瘤治療,但RCC中CD8 + T細胞的高度浸潤與不良預后有關。因此,鑒定與CD8 + T細胞浸潤有關的生物標志物將有助于監測RCC免疫治療反應和探索免疫浸潤機制。


研究內容

該研究內容主要包含以下幾個部分:

 GEO數據庫中下載GSE73731數據,該數據集包含265 ccRCC樣品的轉錄組表達數據;

● 挑選表達值變異系數大于0.1的4411個基因用于后續WGCNA分析;

● CIBERSORT算法評估腫瘤浸潤免疫細胞(TIIC),評估每個樣品的不同細胞亞型的豐度,選擇每個樣品中T細胞的七個亞型的分數作為WGCNA的性狀數據;

● WGCNA分析構建ccRCC基因共表達網絡;

● Hub樞紐模塊的識別和富集分析;

● Hub基因的鑒定和驗證;

● 確定免疫和臨床特征;

● 鑒定預后生物標志物;

● 標記基因功能實驗驗證。



技術路線圖


分析過程及結果展示

1、ccRCC基因共表達網絡分析


通過NCBI網站的GEO數據庫(GSE73731)獲取265 ccRCC樣品的RNA表達數據,挑選出變異系數值大于0.1的4411個基因。CIBERSORT算法評估每個樣品中不同腫瘤浸潤免疫細胞(TIIC)細胞亞型的豐度,選擇每個樣品中T細胞的七個亞型的分數作為WGCNA的性狀數據。隨后,使用R包“ WGCNA”對4411個基因構建共表達網絡,建立無標度網絡,軟閾值β= 3(R2 = 0.8723676)。使用動態混合切割構建層次聚類樹。樹上的每片葉子代表一個基因,具有相似表達數據的基因靠在一起,形成樹的一個分支,代表一個基因模塊。生成了九個模塊。

圖1 注:選擇適當的beta值以構造層次聚類樹。(A)分析1-20軟閾值(β)的無標度擬合指數。(B)分析1-20軟閾值功率的平均連通性。(C)基因通過層次聚類分為不同的模塊,不同的顏色代表不同的模塊。


2、Hub樞紐模塊的識別和富集分析


WGCNA分析得到基因表達模塊與腫瘤浸潤免疫細胞亞型形狀關聯關系,在這九個模塊中,綠色模塊與T細胞CD8(CD8 + T細胞)(R2 = 0.5,P = 2e-18),CD4 激活記憶T細胞(R2 = 0.45,P = 1e-14),伽馬δT細胞(R2 = 0.62,P = 3e-29)高度相關。黃色模塊顯示與CD4 激活記憶T細胞相關(R2 = 0.5,P = 4e-18)。其他模塊與T細胞之間的相關性小于0.5。因此重點關注顯示與CD8 + T細胞相關的綠色模塊,將其識別為核心模塊。接下來,使用網絡工具“Matascape”分析該模塊中包含的基因,進行信號通路和生物學過程富集分析。20個最顯著富集的都是與免疫相關的通路,而三個最富集的是淋巴細胞激活,適應性免疫應答和細胞因子介導的信號通路。


圖2 注:關鍵模塊和功能說明。(A)熱圖顯示模塊特征基因與T細胞浸潤的相關性。(B)基因功能富集分析,富集到的前20個GO和通路描述。右側的網絡圖是將每個富集項作為一個節點,并將該節點的相似性作為邊來構造的。具有相同集群ID的節點具有相同的顏色。


3、Hub基因的鑒定和驗證

上述選定的綠色模塊包含的基因與CD8 + T細胞浸潤水平高度相關的潛在關鍵因素。根據cut off標準(Module-Membership> 0.8,Gene-Significance> 0.5),選擇了30個基因作為候選中心基因。對30個候選中心基因進行蛋白質-蛋白質相互作用(PPI)網絡分析,reliability > 0.7 和connectivity > 15作為cut off,將30個基因鑒定為中心節點,使用Cytoscape可視化。在兩個分析中選擇了十個基因指定為中樞基因(LCK,CD2,CD3D,CD3G,IRF1,IFNG,CCR5,CD8A,CCL5和CXCL9)。為了研究這些中樞基因與CD8 + T細胞之間的關系,進一步在TIMER數據庫中分析了這些基因的表達數據。結果顯示10個基因的表達值與CD8 + T細胞的浸潤水平呈正相關(除CXCL9外,所有其他基因的相關系數至少為0.75)。接下來,查詢TISIDB數據庫以獲得腫瘤浸潤淋巴細胞的豐度與基因表達之間的Spearman相關值。結果表明中樞基因和腫瘤浸潤淋巴細胞之間呈正相關。激活的CD8 + T細胞(Act CD8)和效應記憶CD8 + T細胞(Tem CD8)的相關值最高。這些分析驗證了已鑒定的hub基因與CD8 + T細胞浸潤水平密切相關,并在免疫微環境中發揮重要作用。


圖3 注:hub基因的鑒定。(A)來自綠色模塊的基因的PPI網絡分析。連接的節點數越多,則節點越大。綠色節點表示具有15個以上連接的中央節點。(B)綠色模塊中基因的散點圖。每個綠色點表示一個基因,紅色框中的點表示模塊reliability > 0.7 和connectivity > 15的基因。(C)基于PPI和共表達網絡之間的重疊分子,選擇為Hub基因。


圖4 注:驗證中樞基因和PPI圖的構建。(A)10個hub基因表達與CD8 + T細胞浸潤水平之間的關系;P <0.05。(B)CCL5表達和CD8 + T細胞浸潤水平的散點圖。(C)熱圖顯示了十個已識別的中樞基因與TISIDB數據庫中TIIC之間的相關性。紅色表示相關性較高,綠色表示相關性較低。(D)ccRCC免疫微環境的蛋白質-蛋白質相互作用圖。


4、確定免疫和臨床相關特征


TISIDB數據庫中搜索這10個中樞基因的表達與免疫因子表達的Spearman相關性,包括免疫抑制因子,免疫刺激因子,趨化因子和受體。確定了38個與免疫相關的因子,它們與10個中樞基因的平均相關性均大于0.5。利用STRING數據庫探索CD8 + T細胞的浸潤機制,基于10個中樞基因和38個免疫相關因子構建了一個免疫浸潤相互作用網絡。將結果導入Cytoscape以進行可視化。接下來,TCGA中獲得了ccRCC的10個基因的表達水平。根據Wilcoxon signed-rank檢驗,這些基因在腫瘤組織中的表達水平高于正常組織(P <0.05)?;鹕綀D還顯示,腫瘤組織中10個基因的表達顯著高于正常組織中的表達。腫瘤組織中CCL5和CXCL9的倍數變化比正常組織中的水平高2.5倍以上。箱線圖顯示了中樞基因與病理階段之間的關系。所有中樞基因的表達水平在病理階段均表現出顯著差異(p <0.05),并且隨著階段的增加而呈上升趨勢。最后,作者研究了腫瘤級別與中樞基因之間的聯系,其中LCK,CD2,CD3D,IFNG,CD8A和CCL5與不同級別腫瘤顯著相關(p <0.05),級別增加對應于基因表達增加。盡管未檢測到CD3G,IRF1,CCR5和CXCL9的顯著差異,但隨著腫瘤等級的增加,基因表達水平呈上升趨勢。


圖5 注:TCGA的轉錄數據中的hub基因的差異表達。(A)LCK,藍點代表正常組織,紅點代表腫瘤組織。y軸顯示基因的表達值。(B)CD2。(C)CD3D。(D)CD3G。(E)IRF1。(F)IFNG。(G)CCR5。(H)CD8A。(I)CCL5。(J)CXCL9。(K)差異表達基因的火山圖。紅點表示高表達基因,綠點表示低表達基因,黑圈表示hub基因。


圖6 注:TCGA數據集中的中樞基因和臨床指標分析。(A)不同病理階段中樞基因的箱線圖。(B)不同級別腫瘤的中樞基因的箱線圖。


5、預后生物標志物鑒定


研究者通過Kaplan-Meier分析分析了10個中樞基因,只有CCL5和IFNG的結果具有統計學意義(p <0.05)。對于這兩個基因,高表達患者的生存預后很差。為了驗證腫瘤和正常組織中10個基因的差異表達,我們使用Oncomine數據庫中四個數據集進行了薈萃分析,所有這些數據集均包括腫瘤組織和正常對照。這些數據集不包括IFNG的數據,因此我們獲得了其他9個基因的薈萃分析結果。LCK,CD2,CD3D,CCR5,CCL5和CXCL9的中位秩值小于1000,CD3G為3007.0,IRF1為1445.0,CD8A為1577.0。結果表明這些基因在腫瘤組織中表現出明顯的高表達,這與TCGA數據集分析相一致。通過Kaplan-Meier和Oncomine薈萃分析,我們選擇CCL5作為進一步分析的預后生物標志物。


圖7 注:Kaplan-Meier生存分析和Oncomine meta分析。(A)CCL5的整體生存分析。(B)IFNG的整體生存分析。(C)來自Oncomine數據集的基因表達的meta分析。彩色方塊代表五個數據集中基因的中位數(相對于正常組織)。紅色表示高表達,藍色表示低表達。


6、CCL5基因集富集分析


根據CCL5表達中值,將TCGA的ccRCC樣品分為高表達組和低表達組,然后對基因集進行通路富集分析。富集結果表明,高表達組中免疫相關的途徑被富集,統計上共有23個途徑被顯著富集(p值<0.05,q值<0.05)。三個最顯著富集的途徑是“抗原加工和呈遞”,“細胞粘附分子”和“甲狀腺疾病自身免疫”。低表達組沒有明顯富集的生物學途徑。由于CCL5在ccRCC中過表達且與預后不良有關,因此作者接下來進行功能性實驗以探討CCL5的潛在生物學功能。首先,在腎細胞癌769-P細胞系中使用小干擾RNA來敲低CCL5的表達水平,并通過CCK-8評估細胞的增殖能力。結果顯示CCL5敲低后細胞系增殖能力降低,同時細胞的侵襲能力也顯著下降。


圖9 GSEA和CCL5實驗。(A)GSEA富集分析結果。(B)圓圈圖顯示了三個富集途徑和在富集過程中起作用的核心基因。每個基因對應的圓圈越大,等級度量得分值越大。(C)769-P細胞的正常對照和si-CCL5的相對mRNA水平。(D)CCK-8分析的結果顯示,當用si-CCL5處理時,769-P細胞的增殖能力降低。(E)侵襲測定結果顯示用si-CCL5處理的769-P細胞的侵襲能力降低。


7、討論部分


盡管,目前很多研究通過使用動物腫瘤模型,體外細胞系和臨床樣品對ccRCC的分子機制探索取得了重大進展。但是,ccRCC微環境的復雜性需要進一步分析和更大的數據集。該研究使用基因表達矩陣構建共表達網絡并計算T細胞的浸潤水平,并鑒定與CD8 + T細胞最相關的基因。所選模塊的基因富集分析表明,它是高度免疫相關的模塊。共表達網絡和PPI蛋白互作網絡中連接度最高的基因挑選為中樞基因(LCK,CD2,CD3D,CD3G,IRF1,IFNG,CCR5,CD8A,CCL5和CXCL9)。在TIMER / TISIDB數據庫中查詢這10個基因與免疫細胞之間的關系,發現這些基因的表達與免疫細胞(尤其是CD8 + T細胞)呈正相關。進一步,中樞基因和相關的免疫因子,使用TISIDB和STRING數據庫構建CD8 + T細胞浸潤網絡,探索ccRCC免疫機制。TCGA數據集觀察所選10個基因的差異表達和臨床特征。結果顯示腫瘤組織中10個基因的高表達,表明其可能用作生物標志物。與腫瘤分期和分級增加相關的表達對于潛在的預后因素尤其重要。這10個中樞基因可以解釋為什么在高度浸潤的CD8 + T細胞的情況下ccRCC的預后較差。10個中樞基因Kaplan-Meier生存分析顯示,CCL5和IFNG高表達提示臨床預后較差。使用Oncomine數據庫進行meta分析,癌組織和正常組織之間CCL5表達的差異最大。結合這兩項分析,選擇CCL5作為檢測和預測腎細胞癌預后的最佳潛在生物標志物。  


趨化因子配體5(CCL5)屬于CC趨化因子家族,其主要作用是與其相應的趨化因子受體結合。幾項研究集中于CCL5對腫瘤的作用,發現CCL5可以顯著促進腫瘤生長,轉移,血管生成和免疫逃逸。CCL5不僅在免疫細胞中表達,而且在腫瘤細胞中表達。乳腺癌細胞中CCL5的表達通過自分泌途徑促進乳腺癌細胞的增殖和侵襲。CCL5還促進黑色素瘤和多形性神經膠質瘤的進展。但是,尚無關于CCL5對ccRCC細胞增殖和侵襲作用的實驗研究。該研究實驗結果表明,si-CCL5可以降低ccRCC細胞的增殖和侵襲能力,表明CCL5可以作為治療靶點。簡而言之,這項研究是首次嘗試使用WGCNA和CIBERSORT算法來鑒定ccRCC的潛在CD8 + T細胞相關生物標志物。鑒定了十個hub基因,其在腫瘤中異常高表達并促進腫瘤進展。通過生物信息學和實驗的相互驗證,CCL5被確定為透明細胞腎細胞癌免疫治療的潛在生物標志物和靶標。但是,這項研究有一定的局限性。需要更多樣本數據來驗證這些結果,并且ccRCC中CCL5的具體機制需要進一步研究。



參考文獻

1. Lin J, Yu M, Xu X, et al. Identification of biomarkers related to CD8+ T cell infiltration with gene co-expression network in clear cell renal cell carcinoma[J]. Aging (Albany NY), 2020, 12(4): 3694.


排列三助手下载