高分SCI使用

您所在的位置:网站首页 cutoff值计算方法proc 高分SCI使用

高分SCI使用

2024-01-25 19:34| 来源: 网络整理| 查看: 265

原标题:高分SCI使用 | 限制性立方样条(Restricted cubic spline,RCS)

一般医学研究中,我们经常会通过构建回归模型来分析自变量和因变量之间的关系。但是,大多数回归模型有一个重要的假设条件:自变量和因变量呈线性关联。

这个条件一般难以满足。当条件不满足时,可以①将连续型变量转化为分类变量,但是分类变量的类别数目以及节点位置的选择一般会带有主观性并且分类变量会损失部分信息;②也可以直接拟合自变量和因变量之间的非线性关系。

若自变量x与因变量y之间存在非线性关系时,常用的方法是绘制限制性立方样条图(Restricted cubic spline,RCS)。

非线性关系与限制性立方样条图

非线性关系可以构建多项式回归或者样条回归来进行说明,但是直接构建多项式回归存在以下问题:①过度拟合②共线性③全局性(全局性是针对所有数据讲的,也就是说所有用来拟合的数据都需要符合多项式的规律)。

但当所有数据不能用一种关系来表示时(即可能有的数据在小于某个值之前是直线关系,在到了这个值以后是二次项关系),这种情况下需要构建样条回归,才可更准确的描述连续变量与结局之间的关系。

样条回归是由于数据在自变量取不同范围时有不同变化趋势,需要将数据分开,分别拟合模型,可以拟合直线、二次项、三次项式回归,其中拟合回归的类型根据实际情况而定。

样条回归本质上其实是一个分段多项式,但它一般要求每个节点上连续且二阶可导,这样是为了保证曲线的平滑性。适用条件为①数据无法用一条直线描述②数据多项式回归效果一般好③本身想要了解某个事件前后变化的趋势④发现数据在某个节点前后趋势发生了改变。

其中如果数据全部看起来是一个变化趋势,那么没必要进行样条回归。样条回归和分段回归区别在于前者是加了约束条件的后者,因为有的变量是一个缓慢变化的过程,分段回归使每个段的内部效应被强制统一, 在节点的位置跳跃,“瞬时变化”不合理, 这不但不符合很多实际情况, 而且不能发现最大值和最小值的点。

由于加了约束条件,正常情况下会导致其拟合效果稍差于分段回归,但是分析自变量和因变量之间的关系会更加合理。

样条回归往往会在曲线的两头,预测的区间会非常宽,因此需要再加一个边界限制条件,即限制性立方样条图。限制性立方样条是在回归样条的基础上再加一个约束条件,即样条函数在自变量数据范围两端的两个区间内为线性函数,这样使得两边的预测更为准确一些。

使用限制性立方样条图绘制非线性关系时,即将连续变量分为几段,进行分段回归,通常需要设置样条函数截断值的个数以及位置。大多数情况下截断值的位置基本不会影响限制性立方样条的拟合效果,截断值的个数会决定曲线的形状。

当节点个数等于样本量时, 相当于将各个点用线段相连, 得到的是完全拟合但是不平滑的折线。由于节点个数的选择和自由度有关, 所以当样本量比较大的时候可以取较多的节点。但是节点越多, 自由度越大, 模型越复杂, 越难解释。

在«Regression Modeling Strategies»这本书中,Harrell建议节点数为4时,模型的拟合效果较好,即同时可以兼顾曲线的平滑程度以及避免过拟合造成的精确度降低。当样本量较大时,5个节点是更好的选择。小样本(n



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3