什么是生物标志物? |
您所在的位置:网站首页 › guts标志 › 什么是生物标志物? |
1.研究现状 1. 1 什么是生物标志物? 生物标志物(Biomarker)是指可以标记系统、器官、组织、细胞及亚细胞结构或功能的改变或可能发生的改变的生化指标。Biomarker相关研究在科研领域极受欢迎,既可以平衡临床工作,又能兼顾基础研究,具有非常广泛的用途。人体内存在多种不同的生物标志物,并且随着分子生物学技术的不断进展,生物标志物包括的种类也越来越多, 包括基本身体状况、影像资料(例如乳房X线照片)、特定的分子(例如前列腺特异性抗原PSA)、基因突变 (例如BRCA突变)、细胞标记(例如循环肿瘤细胞)以及蛋白质或代谢物等生物分子的生物标志物。 1.2 标志物研究手段 1.3 标志物类型及研究卡点 Biomarker相关研究文献Biomarker类型: 诊断标志物:区分疾病和非疾病组 预后标志物:评价疗效好坏 预测标志物:预测疾病发生或筛选受益人群 Biomarker研究卡点: 样本队列收集:队列越大,biomarker越准确科研经费:国家资助力度在加大筛选:需要专业的生信分析团队---高级生信分析1.4 高分文章 发表时间发表期刊IF文章名称研究内容2019Gastroenterology20.773Tyrosine and Glutamine-Leucine Are Metabolic Markers of Early-Stage Colorectal Cancers早期结直肠癌的代谢标志物2019Gut17.943Serum metabolites detect the presence of advanced fibrosis in derivation and validation cohorts of patients with non-alcoholic fatty liver disease血清代谢组研究酒精性脂肪肝生物标志物2020cell38.637Integrative Proteomic Characterization of Human Lung Adenocarcinoma多组学揭示肺腺癌潜在的预后生物标志物和药物靶标2020Nature Medicine36.13Large-scale proteomic analysis of Alzheimer's disease brain and cerebrospinal fluid reveals early changes in energy metabolism associated with microglia and astrocyte activation蛋白组发现阿尔兹海默症新的潜在治疗靶标和生物标志物2020cell38.637Mortality Risk Profiling of Staphylococcus aureus Bacteremia by Multi-omic Serum Analysis Reveals Early Predictive and Pathogenic Signatures血清蛋白组和代谢组揭示败血症患者预后标志物2020Cell38.637Proteomic and Metabolomic Characterization of COVID-19 Patient Sera新冠患者血清的蛋白质组学和代谢组学特征2 研究思路 2.1样本收集 2.2 组学技术选择 2.3 组学数据分析 2.4 锁定目标分子 2.5 大队列验证 2.6 临床验证 3 数据挖掘 3.1 如何筛选有效生物标志物? 3.2 分析路线 3.3 筛选 -- Cox 回归分析 Cox回归,又称比例风险回归模型(proportional hazards model,简称Cox模型),可对生存期进行单因素及多因素分析,是生存分析中最常用的统计方法。采用Cox回归分析模型计算各差异表达蛋白质/代谢物与生存时间之间的关系,筛选出影响生存的生物标志物。RR(Relative Risk) - 相对危险度,是指 2 个人群发病率的比值,通常为实验组的发病率和对照组发病率之比。RR 的计算公式是[RR=实验组死亡率/对照组发病或死亡率]。 暴露因素肺癌非肺癌吸烟(3000)a(300)b(2700)不吸烟(7000)c(70)d(6930)RR=(a/(a+b))/(c/(c+d))HR(Hazard Ratio)即风险比,主要用于生存分析。HR 的解释与 RR 相似,即表示实验组患病的概率为对照组的多少倍。区别在于 RR 只考虑结局是否发生,而 HR 还考虑了结局发生的时间,因此可以认为 HR是考虑了时间因素的RR。(大于1是危险因素,小于1是保护因素) 3.4 筛选 -- LASSO分析 最小绝对收缩和选择算子(Least absolute shrinkage and selection operator,LASSO)方法是以缩小变量集(降阶)为思想的压缩估计方法。它通过构造一个惩罚函数,可以将变量的系数进行压缩并使某些回归系数变为0,进而达到变量选择的目的。 Lasso是在RSS (最小化残差平方和)最小化的计算中加入一个L1范数作为惩罚项。λ是调节参数,其不同的大小可以决定纳入模型中变量数量的变化。 3.5 验证 – 随机森林分析 随机森林(Random forest,RF)是一个包含多个决策树的集成分类器。 首先,以随机的方式建立一个包含多个决策树的森林,随机森林中的决策树相互独立,之间没有关联;然后,当有一个新的样本进入的时候,就让森林中的每一棵决策树分别进行一次判断,确定该样本属于哪一类,最终哪一类被选择最多,则预测这个样本属于该类。 mean decrease accuracy:把一个变量的取值变为随机数,随机森林预测准确性的降低程度。该值越大表示该变量的重要性越大。 mean decrease gini:计算每个变量对分类树每个节点上观测值的异质性的影响,从而比较变量的重要性。该值越大表示该变量的重要性越大。3.6 验证 – 支持向量机分析 支持向量机(support vector machine,SVM)是90年代中期发展起来的基于统计学习理论的一种机器学习方法。 通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较少的情况下,亦能获得良好统计规律的目的。它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,即支持向量机的学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。所需数据: 1.蛋白定量值表格(all_sample.xls) 2.样本分组信息 推荐样本数:30(>50个效果较好)交付结果:ROC图、结果表格、readme3.7 验证 – Logistic回归分析 逻辑回归(Logistic)的过程可以概括为:面对一个回归或者分类问题,建立代价函数,然后通过优化方法迭代求解出最优的模型参数,然后测试验证我们这个求解的模型的好坏。Logistic 回归虽然名字里带“回归”,但是它实际上是一种分类方法,主要用于两分类问题(即输出只有两种,分别代表两个类别)。 3.8 验证 – 基础表达分析 基础表达分析候选生物标志物在组间的相对丰度,并采用T-Test分析其显著性,确认其在组间的差异性。 4.案例分享 本章节的生物标志物案例分享,安排在下一篇文章。若想提前查阅文献思路或者本文PDF的老师,可以添加微信发送姓名-单位-邮箱可免费获取生物标志物解决方案的PDF。 如果您觉得这篇文章对您有帮助,请转发给您身边的老师、同学和朋友。也许你的转发,就能帮他顺利开展实验、早日毕业、早日发文。 祝好! 欢迎长按二维码或者点击名片,添加您身边的科研小助手! |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |