8 转录本及基因定量[Quantification of transcript and gene]

您所在的位置:网站首页 genes的翻译 8 转录本及基因定量[Quantification of transcript and gene]

8 转录本及基因定量[Quantification of transcript and gene]

2023-11-01 20:24| 来源: 网络整理| 查看: 265

8 转录本及基因定量[Quantification of transcript and gene]

本节通过分别将各个样本的测序数据与拼接转录本进行比对,得到各样本转录本和基因表达情况。并对样本中的基因表达进行了初步的探索性分析。

8.1 转录本丰度[Transcript Quantification]

方法[Method]

转录本和基因水平的丰度估计了使用salmon(v0.15.0),合并各个样本的丰度数据得到reads数量矩阵,作为下游分析工具EdgeR的输入。 Transcript and gene-level abundance estimates got by running salmon(v0.15.0). Merge abundence data of each sample to bulid counts matrices,which is the input file of EdgeR for downstream analysis.

表达矩阵[expression matrix]

为了衡量表达水平,我们需要计算测序数据中每个转录本、基因对应的序列数量即counts of reads。转录本在测序中得到的序列数量受转录水平、测序深度、转录本序列长度、样本中其他转录本的表达水平等因素影响。为了能够进行样本内不同基因之间的纵向比较,以及样本间相同基因的横向比较,我们需要对这些因素的影响加以矫正去除。这里我们采用TPM指标,该指标便于比较不同基因相对丰度的高低。

TPM为表达丰度进行样本内归一化后的值,归一化过程消除测序深度与基因长度对丰度计算的影响。 TPM即Transcript per million,表示样本中平均每一百万个转录本中对应于特定基因或转录本的数量,例如某个基因在样本中为1 TPM时,表明该基因的转录本在所有转录本中占比为百万分之一。

我们为您计算了转录本水平和基因水平的reads数量及TPM:

转录本:

所有样本全部转录本的reads数量表 : counts for isoform The table for counts of reads across all transcripts and all samples. 转录本在各样本中的表达水平TPM表 : isoform TPM summary The table for TPMs across all transcripts and all samples.

基因:

所有样本全部基因的reads数量表 : counts for genes The table for counts of reads across all genes and all samples. 转录本在各样本中的表达水平TPM表 : gene TPM summary The table for TPMs across all genes and all samples.

8.2 转录本TPM分布

isoform with Sum(log2(TPM+1)) > 1 152648

8.3 基因TPM分布

gene with Sum(log2(TPM+1)) > 1 120246



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3