什么是生物标志物?

您所在的位置:网站首页 guts标志 什么是生物标志物?

什么是生物标志物?

#什么是生物标志物?| 来源: 网络整理| 查看: 265

1.研究现状

1. 1 什么是生物标志物?

生物标志物(Biomarker)是指可以标记系统、器官、组织、细胞及亚细胞结构或功能的改变或可能发生的改变的生化指标。Biomarker相关研究在科研领域极受欢迎,既可以平衡临床工作,又能兼顾基础研究,具有非常广泛的用途。人体内存在多种不同的生物标志物,并且随着分子生物学技术的不断进展,生物标志物包括的种类也越来越多, 包括基本身体状况、影像资料(例如乳房X线照片)、特定的分子(例如前列腺特异性抗原PSA)、基因突变 (例如BRCA突变)、细胞标记(例如循环肿瘤细胞)以及蛋白质或代谢物等生物分子的生物标志物。

1.2 标志物研究手段

1.3 标志物类型及研究卡点

Biomarker相关研究文献

Biomarker类型:

诊断标志物:区分疾病和非疾病组

预后标志物:评价疗效好坏

预测标志物:预测疾病发生或筛选受益人群

Biomarker研究卡点:

样本队列收集:队列越大,biomarker越准确科研经费:国家资助力度在加大筛选:需要专业的生信分析团队---高级生信分析

1.4 高分文章

发表时间发表期刊IF文章名称研究内容2019Gastroenterology20.773Tyrosine and Glutamine-Leucine Are Metabolic Markers of Early-Stage Colorectal Cancers早期结直肠癌的代谢标志物2019Gut17.943Serum metabolites detect the presence of advanced fibrosis in derivation and validation cohorts of patients with non-alcoholic fatty liver disease血清代谢组研究酒精性脂肪肝生物标志物2020cell38.637Integrative Proteomic Characterization of Human Lung Adenocarcinoma多组学揭示肺腺癌潜在的预后生物标志物和药物靶标2020Nature Medicine36.13Large-scale proteomic analysis of Alzheimer's disease brain and cerebrospinal fluid reveals early changes in energy metabolism associated with microglia and astrocyte activation蛋白组发现阿尔兹海默症新的潜在治疗靶标和生物标志物2020cell38.637Mortality Risk Profiling of Staphylococcus aureus Bacteremia by Multi-omic Serum Analysis Reveals Early Predictive and Pathogenic Signatures血清蛋白组和代谢组揭示败血症患者预后标志物2020Cell38.637Proteomic and Metabolomic Characterization of COVID-19 Patient Sera新冠患者血清的蛋白质组学和代谢组学特征

2 研究思路

2.1样本收集

2.2 组学技术选择

2.3 组学数据分析

2.4 锁定目标分子

2.5 大队列验证

2.6 临床验证

3 数据挖掘

3.1 如何筛选有效生物标志物?

3.2 分析路线

3.3 筛选 -- Cox 回归分析

Cox回归,又称比例风险回归模型(proportional hazards model,简称Cox模型),可对生存期进行单因素及多因素分析,是生存分析中最常用的统计方法。采用Cox回归分析模型计算各差异表达蛋白质/代谢物与生存时间之间的关系,筛选出影响生存的生物标志物。RR(Relative Risk) - 相对危险度,是指 2 个人群发病率的比值,通常为实验组的发病率和对照组发病率之比。RR 的计算公式是[RR=实验组死亡率/对照组发病或死亡率]。

暴露因素肺癌非肺癌吸烟(3000)a(300)b(2700)不吸烟(7000)c(70)d(6930)

RR=(a/(a+b))/(c/(c+d))HR(Hazard Ratio)即风险比,主要用于生存分析。HR 的解释与 RR 相似,即表示实验组患病的概率为对照组的多少倍。区别在于 RR 只考虑结局是否发生,而 HR 还考虑了结局发生的时间,因此可以认为 HR是考虑了时间因素的RR。(大于1是危险因素,小于1是保护因素)

3.4 筛选 -- LASSO分析

最小绝对收缩和选择算子(Least absolute shrinkage and selection operator,LASSO)方法是以缩小变量集(降阶)为思想的压缩估计方法。它通过构造一个惩罚函数,可以将变量的系数进行压缩并使某些回归系数变为0,进而达到变量选择的目的。

Lasso是在RSS (最小化残差平方和)最小化的计算中加入一个L1范数作为惩罚项。λ是调节参数,其不同的大小可以决定纳入模型中变量数量的变化。

3.5 验证 – 随机森林分析

随机森林(Random forest,RF)是一个包含多个决策树的集成分类器。

首先,以随机的方式建立一个包含多个决策树的森林,随机森林中的决策树相互独立,之间没有关联;然后,当有一个新的样本进入的时候,就让森林中的每一棵决策树分别进行一次判断,确定该样本属于哪一类,最终哪一类被选择最多,则预测这个样本属于该类。 mean decrease accuracy:把一个变量的取值变为随机数,随机森林预测准确性的降低程度。该值越大表示该变量的重要性越大。 mean decrease gini:计算每个变量对分类树每个节点上观测值的异质性的影响,从而比较变量的重要性。该值越大表示该变量的重要性越大。

3.6 验证 – 支持向量机分析

支持向量机(support vector machine,SVM)是90年代中期发展起来的基于统计学习理论的一种机器学习方法。

通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较少的情况下,亦能获得良好统计规律的目的。它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,即支持向量机的学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。

所需数据:

1.蛋白定量值表格(all_sample.xls)

2.样本分组信息

推荐样本数:30(>50个效果较好)交付结果:ROC图、结果表格、readme

3.7 验证 – Logistic回归分析

逻辑回归(Logistic)的过程可以概括为:面对一个回归或者分类问题,建立代价函数,然后通过优化方法迭代求解出最优的模型参数,然后测试验证我们这个求解的模型的好坏。Logistic 回归虽然名字里带“回归”,但是它实际上是一种分类方法,主要用于两分类问题(即输出只有两种,分别代表两个类别)。

3.8 验证 – 基础表达分析

基础表达分析候选生物标志物在组间的相对丰度,并采用T-Test分析其显著性,确认其在组间的差异性。

4.案例分享

本章节的生物标志物案例分享,安排在下一篇文章。若想提前查阅文献思路或者本文PDF的老师,可以添加微信发送姓名-单位-邮箱可免费获取生物标志物解决方案的PDF。

如果您觉得这篇文章对您有帮助,请转发给您身边的老师、同学和朋友。也许你的转发,就能帮他顺利开展实验、早日毕业、早日发文。

祝好!

欢迎长按二维码或者点击名片,添加您身边的科研小助手!



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3