蛋白质组学基础入门系列

2024-07-11 16:45| 来源: 网络整理| 查看: 265

前言

本系列第七讲为大家介绍了搜库的相关内容，使用Maxquant对原始谱图搜库完成后，可以得到大量蛋白质的鉴定和定量信息。下一步就需要通过统计分析和生物信息学分析，从搜库得到的大量信息中筛选和寻找关键蛋白和信号通路，以及进行相关功能的验证。本讲我们会为大家介绍如何进行蛋白质组学的定量数据分析以及结果展示，主要包括：蛋白质鉴定和定量数据统计、差异表达蛋白筛选、功能注释和富集分析以及蛋白互作网络分析。

定量数据统计和展示

在蛋白质组学数据分析过程中，首先会对所有的鉴定和定量数据进行统计和展示，主要关注蛋白鉴定数目、肽段鉴定数目、肽段分布情况以及样品相关性和重复性等内容，展示蛋白质组学数据的定量深度、可信度和重复性等。

如下图所示，蛋白质组定量深度主要体现在各个样品中鉴定及定量到的蛋白和肽段数量，数量越多，表明定量深度越深，意味着能够获得更全面的蛋白质组学信息。同时，不同样品间定量深度的差异，也可以初步反映样品和方法的重复性和稳定性。

（肽段数量统计图（上）和蛋白数量统计图（下）[1]）

蛋白质组学数据的可信度，可通过各个蛋白鉴定到的肽段数量以及各条肽段鉴定到的谱图数量分别展示。一般认为鉴定到2条及以上肽段的蛋白或2张及以上谱图的肽段为可信度更高的鉴定结果。

（谱图数量分布图（上）/肽段数量分布图（下） [1]）

蛋白质组定量数据的相关性和重复性可通过相关系数来体现，组内样品间的蛋白质组定量相关系数往往较高，而组间样品的相关系数则会稍低（如左图）。PCA分析则是通过降维算法，将数百乃至上万个蛋白的定量数据降维为2个或3个反映定量特征的主成分，从而直观展示不同样品之间的定量相关性，在空间位置上接近的点表明其定量特征接近，也就是数据相关性更高。同一组的样品在PCA分析结果中往往会更为聚集（如右图）。

（相关系数热图（左）和PCA分析图（右）[2]）

定量热图也是蛋白质组学中常用的展示定量数据的结果图形。在定量热图中，通常每一列代表一个样品，每一行代表一个蛋白，以色块颜色表示各个样品中蛋白的定量水平。通过颜色的变化和分布可以直观的展示不同样品中蛋白定量水平的相关性和差异性。

（蛋白定量热图[3]）

差异表达分析

找出不同处理组间差异表达蛋白是蛋白质组学研究的重要目标之一。统计学上一般选取P值（P-value）和差异倍数（Fold change）两个参数实现差异蛋白的筛选，其中P-value由比较两组样品蛋白定量数据的T检验计算得出，要求各组样品数量不少于3个；Fold change是两样品中同一个蛋白的表达差异倍数，主要根据蛋白定量值计算。如下图所示，根据显著性P1.5或

【本文地址】

蛋白质组学基础入门系列

蛋白质组学基础入门系列

今日新闻

推荐新闻