Loading...
如何绝对定量肿瘤干性指数-其他-智连星医

如何直观地评估干性目前尚无标准。这篇文章认为,基于绝对表达值得到的干性指数,严重的受批次效应和数据集样本的组成等影响。因此,作者基于基因的相对表达秩序(REOs)识别肿瘤干性基因对,发现基于干性指数有助于区分多种肿瘤的分级,具有指导肿瘤预后及治疗的潜力。

干细胞具有自我更新和分化成成熟细胞的能力 。据报道,癌症的进展往往伴随着干性特征的获得。与相应的正常样本相比,在不同的癌症中发现干性基因的高表达。为了更好地了解干细胞和癌症之间的关系,提出了许多基于转录特征的方法来评估肿瘤组织的干性。例如,根据文献中的干性基因,Alex等人使用单样本基因集富集分析(ssGSEA)推断出癌症的干性。然而,这种方法无法直观地评估干性的绝对值大小。另外,Tathiane M. 等人提供了一种称为 mRNASi 的方法,基于一类回归机器学习算法来评估干性。虽然 mRNASi 在感兴趣的数据集中被映射到 0-1的范围,将干性指数量化,但这种线性转换可能使 mRNASi 易受样本成分的影响。

    上述两种指数都基于基因的绝对表达值,这使得这些指数受到批量效应和样本内规范化偏差的严重影响。因此,当前的指数无法有力地应用于其他独立数据,无法为给定的样本提供稳定的绝对干性指数值,这意味着这些方法无法反应真正的干性。


一、过去常用干性指数的缺点

      前两个基于 ssGSEA 和 mRNASi的干性指数,在五个不同的 SC 数据集(GSE108115;GSE30652;GSE60996;GSE69626;GSE90749)进行了评估。如图 1A 所示,尽管基于 ssGSEA 的茎指数值集中在不同数据集中的某些值周围,但我们发现每个数据集之间基于 ssGSEA 的干性指数值存在显著差异( T 检验,P < 0.05)。对mRNASi(图1B)也观察到了类似的结果。显示了以前干性指数的不稳定性,这使得这些指数无法稳定地用于不同的数据集。

      本文作者首先从 PCBC数据库评分了由 81 个 SC 和 169 个不同分化程度的祖先SC的数据集的 mRNASi 值。接着从上述数据集中提取了 81 个 SC 样本,并重新标示了这些样本的 mRNASi 值。第三,在删除 81 个样本中具有最低 mRNAI 的一个样本后,我们重新计算了其余 80 个样本的 mRNASi 值。对于上述三个样本集中的 80 个相同样本,使用不同的样本集(图 1C)可以大大改变同一样本集的 mRNASi。对于每个示例,进一步计算了三个 mRNASi 值 (图 1D) 的变异系数 (CV)。约52.5%的样本显示至少10%的CV,13.75%的样本显示至少20%的CV。特别是80个样本中最低mRNASi的样本的CV达到0.88。这些结果清楚地表明,mRNASi 对样本成分的不稳定性,尤其是对于 mRNASi 最小的样本。

二、基于 REO 的干性指数

    首先,在124个干细胞样本(至少99%的样本)和2704个正常成人组织样本(至少99%的样本)中,鉴定了242 110个具有反向基因对的基因对。同样,基于 Illumina 平台测量的样本,文章在 159 个干细胞样本(至少99%的样本)及20个正常样本(至少99%的样本)中发现 1 011 885 个具有反转基因对的基因对。上述两个反转基因对列表的交集为 42 472 个基因对,这些基因对被选为最终的干细胞对。

      基于 REO 的茎指数范围为 0 到 1,SC样本的干性指数应接近最大值 1,正常成人组织样本应接近最小值0。为了验证此结论,文章在独立验证集(表 1)中进行验证。数据集 GSE90749 中的 68 个 SC 样本的干性指数中位数为 0.993,数据集 GSE120795 中的 148 个正常成人组织样本的干性指数中位数为 0.032(图 3A)。此外,由于SC分化时间的增加导致干性的减少,文章进一步评估了SC样本的干性,这些样本在不同的培养时间分化成心肌细胞、神经细胞、肝细胞、胰腺细胞和内皮(表2)。

三、人类中影响干性的关键基因和途径

     根据 PCBC 数据库中的 230 个样本,文章确定了 11 163 个与干性指数有显著相关性的基因(FDR < 0.05)。在这些基因中,文章展示了在基于REO的干细胞基因对中参与基因对数量最多的前五个基因,这些基因可能是中心基因。值得注意的是,这五个基因都与干性指数有很强的正相关关系,其中四个基因的相关系数均超过0.8。功能丰富分析表明,在这些基因中,2218个正相关基因在与遗传信息处理和细胞过程(如"RNA传输","DNA复制"和"细胞周期")相关的通路中显著丰富,1488个负相关基因在干细胞相关通路中显著丰富,这些途径在干细胞分化中起着重要作用,例如"ECM 受体相互作用","PI3K-Akt 信号通路"和"MAPK 信号通路"。

四、基于REO的干性指数与肿瘤分级和临床结果的预测高度相关

      为了验证癌症的干性指数,我们评估了基于REO的使用 TCGA 中的 RNA-seq 转录数据中使用 13 种不同癌症的干性指数。结果显示,大多数癌症类型中基于REO的干性指数值与肿瘤分级之间呈正相关关系,13种癌症类型中的9种中具有显著正相关性(图5A),这表明基于REO的干细胞指数可以很好地应用于癌症样本,并为临床分级工作提供基于基因表达的定量值。如图5C所示,COX回归分析表明基于REO的干性指数是预后的危险因素,这与先前关于干性是癌症中预后因子的研究一致。以上结果表明,基于REO的干性指数与肿瘤分级相关性高,预后能力优于肿瘤分级,表明它拥有辅助肿瘤分级及指导治疗的潜力。

五、基于REO的干性指数显示了癌症和正常组织之间的巨大差异,并揭示了肿瘤内异质性

      为了进一步评估癌症中基于REO的干性指数,文章在TCGA中对23种不同癌症的REO干细胞指数进行了评分。如图 5B 所示,正常组织的干性指数值往往集中在0左右,癌症的指数值显示较高的变异性,这揭示了肿瘤内异质性。此外,我们发现,除胸腺外,所有癌症的干性指数都明显高于相应的正常组织(t test,P<0.001)。值得注意的是,干细胞指数将宫颈癌和正常宫颈组织分为两部分,没有交叉,这表明干细胞指数有可能将癌症与宫颈癌的正常组织分离。

在这项研究中,文章揭示了过去肿瘤干性指数的不稳定性(ssGSEA为基础的茎指数和mRNAsi),并开发了一个绝对的REO为基础的干性指数。REO为基础的干性指数是基于 REO 的signature,对批次效应的适应能力非常强大,可稳定地应用于独立数据集。

全部评论(
查看更多
热点榜
    遮罩