R

2023-09-18 12:13| 来源: 网络整理| 查看: 265

gamm 广义加性混合模型 Description

通过在正常错误身份链接情况下调用 lme 或通过调用 gammPQL （来自 MASS 库的 glmmPQL 的修改）将指定的广义加性混合模型 (GAMM) 拟合到数据。在后一种情况下，估计值仅为近似 MLE。该例程通常比 gam 慢，并且在数值上不那么稳健。

要使用 lme4 代替 nlme 作为底层拟合引擎，看到 gamm4 从包 gamm4 。

平滑在调用 gam 时被指定为固定效应模型公式的一部分，但平滑的摆动组件被视为随机效应。 lme 可用的随机效应结构和相关结构用于指定其他随机效应和相关性。

假设随机效应和相关结构主要用于模拟数据中的残余相关性,而主要的兴趣在于推断固定效应模型公式中的项,包括平滑值。为此,该程序计算了固定效应公式中所有项的系数的后验协方差矩阵,包括平滑值。

要有效地使用此功能，熟悉 gam 和 lme 的使用会有所帮助。

Usage gamm(formula,random=NULL,correlation=NULL,family=gaussian(), data=list(),weights=NULL,subset=NULL,na.action,knots=NULL, control=list(niterEM=0,optimMethod="L-BFGS-B",returnObject=TRUE), niterPQL=20,verbosePQL=TRUE,method="ML",drop.unused.levels=TRUE, mustart=NULL, etastart=NULL,...) Arguments formula

甲GAM式（也参见 formula.gam 和 gam.models ）。这类似于 glm 的公式，只是可以将平滑项（ s 、 te 等）添加到公式的右侧。请注意，不支持用于平滑和固定平滑参数的 id 。应在公式中指定任何偏移量。

random

在对 lme 的调用中指定的（可选）随机效应结构：只允许 list 形式，以便于在 gamm 中操纵随机效应结构以处理平滑项。请参阅下面的示例。

correlation

一个可选的 corStruct 对象（参见 corClasses ），用于在 lme 中定义相关结构。假定此对象的公式中的任何分组因子都嵌套在任何随机效应分组因子中，无需在公式中明确说明（这与 lme 的行为略有不同）。这是通用情况下的 GEE 相关性方法。请参阅下面的示例。

family

一个 family 作为一个呼叫使用 glm 或 gam 。如果没有偏移项，带有标识链接的默认 gaussian 会导致 gamm 通过直接调用 lme 来拟合，否则使用 gammPQL 。

data

包含模型响应变量和公式所需协变量的数据框或列表。默认情况下，变量取自 environment(formula) ，通常是调用 gamm 的环境。

weights

在一般情况下，权重与 glm 权重具有相同的含义。的 lme 类型的权重参数可以仅在身份链接高斯情况下可以使用，没有偏移（参见文档 lme 对于如何使用这样的说法详情）。

subset

一个可选的向量,指定拟合过程中使用的观测值子集。

na.action

指明当数据包含 "NA "时应该发生什么的函数。默认值由'options'的'na.action'设置,如果没有设置则为'na.fail'。出厂时的默认值是 "na.省略"。

knots

这是一个可选的列表,包含用户指定的结值,用于构建基础。不同的术语可以使用不同数量的结,除非它们共享一个协变量。

control

lme 的适合控制参数列表，用于替换 lmeControl 返回的默认值。请注意 lme 使用的 EM 迭代次数的设置：平滑是使用自定义 pdMat 类设置的，EM 迭代代码目前不支持这些类。如果您提供一个控制值列表，建议也包括 niterEM=0 ，并且如果您想扰乱模型拟合中使用的起始值（通常是更糟的值！），则仅从 0 开始增加。该 optimMethod 如果您的R版本没有此选项仅用于 nlminb 优化功能。

niterPQL

PQL迭代的最大数量(如果有的话)。

verbosePQL

PQL是否应该边走边报告其进展?

method

直接调用 lme 时，在高斯加法混合模型情况下使用 "ML" 或 "REML" 哪个。在一般情况下（或如果模型有偏移）忽略，在这种情况下使用 gammPQL 。

drop.unused.levels

默认情况下,未使用的水平会在拟合前从因子中删除。对于一些涉及因子变量的平滑,你可能想把它关掉。只有在你知道自己在做什么的情况下才会这样做。

mustart

如果使用PQL,则为平均值的起始值。

etastart

如果使用 PQL，则线性预测器的 mustart 如果提供，则覆盖mustart）。

...

传递给例如 lme 的进一步论据

Details

Wahba (1983) 和 Silverman (1985) 引入的样条平滑贝叶斯模型开辟了在广义加性模型中估计项平滑程度的可能性，作为被视为随机效应的平滑项的摆动分量的方差。几位作者已经认识到这一点（参见 Wang 1998；Ruppert、Wand 和 Carroll，2003）并且在正常错误中，可以使用通用线性混合效应建模软件（例如 lme )执行身份链接案例估计。在一般情况下，目前只有近似推断可用，例如使用 Breslow 和 Clayton (1993) 的惩罚准似然方法，在 glmmPQL 中实现维纳布尔斯和里普利 (2002)。这种方法的一个优点是它允许通过随机效应或 nlme 库中可用的相关结构来处理相关错误（使用超出严格相加情况的相关结构相当于使用 GEE 拟合方法）。

关于 GAM 如何表示为混合模型以及在 gamm 中使用 lme 或 gammPQL 进行估计的一些细节可以在 Wood (2004,2006a,b) 中找到。此外， gamm 获得所有固定效应和平滑项的参数的后验协方差矩阵。该方法类似于 Lin & Zhang (1999) 中描述的方法——基于权重、相关性和随机效应结构所隐含的数据（或广义情况下的伪数据）的协方差矩阵，基于对这些术语和 this 用于获得固定和平滑效果的后验协方差矩阵。

用于表示平滑项的基数与 gam 中使用的基数相同，尽管自适应平滑基数不可用。使用 predict.gam 可以直接从返回的 gam 对象进行预测，但这会将随机效应设置为零。如果您想使用设置为其预测值的随机效应进行预测，那么您可以调整以下示例中给出的预测代码。

在 lme 收敛失败的情况下，考虑修改 options(mgcv.vc.logrange) ：减少它有助于消除可能性中的不确定性，如果这是问题，但减少太大可能会导致过度或不平滑。有关此选项的更多信息，请参阅 notExp2 。如果失败，您可以尝试增加 control 的 niterEM 选项：这会扰乱拟合中使用的起始值，但通常是可能性较低的值！请注意，此版本的 gamm 最适用于 R 2.2.0 或更高版本以及 nlme 3.1-62 及更高版本，因为它们使用了改进的优化器。

Value

返回一个有两个项目的列表。

gam

类 gam 的对象，与 GCV/UBRE 模型选择相关的信息较少。目前这款包含足够的信息来使用 predict ， summary 和 print 方法和 vis.gam ，但不要使用如 anova 方法功能比较模型。这是基于使用 gammPQL 时的工作模型。

lme

lme 或 gammPQL 返回的拟合模型对象。请注意，模型公式和分组结构可能看起来很奇怪，因为 GAMM 的拆分方式以及对 lme 和 gammPQL 的调用的构造方式。

WARNINGS

gamm 与 gam 的参数列表有些不同，提供给 gamm 的 gam 参数（例如 gamma )将被忽略。

gamm 在处理二进制数据时表现不佳，因为它使用 PQL。最好将 gam 与 s(...,bs="re") 术语或 gamm4 一起使用。

gamm 假设您知道自己在做什么！例如，与 MASS 的 glmmPQL 不同，它将在 PQL 迭代收敛时从工作模型返回完整的 lme 对象，包括“对数似然”，即使这不是拟合 GAMM 的似然。

例如,绝对不建议用许多1000个数据来运行例子中的空间例子:通常情况下,相关关系应该只适用于可以由分组因子定义的群组内,只要这些群组不会变得太大,那么拟合通常是可能的。

模型必须至少包含一个随机效应：平滑参数不为零的平滑，或参数 random 中指定的随机效应。

gamm 在数值上不如 gam 稳定： lme 调用偶尔会失败。有关建议，请参阅详细信息部分，或尝试“gamm4”包。

gamm 通常比 gam 慢得多，并且在某些平台上，您可能需要增加 R 可用的内存，以便将其用于大型数据集（请参阅 memory.limit ）。

注意,在拟合的GAM对象中返回的权重是假的,而不是PQL迭代所使用的权重:这使得部分残差图看起来很奇怪。

请注意，返回对象的 gam 对象部分在 gamObject 中定义的所有元素的意义上是不完整的，并且不是从 glm 继承的：因此，例如多模型 anova 调用将不起作用。它也是基于使用 PQL 时的工作模型。

用于 gamm 中的平滑参数的参数化通过有效无穷大和有效零限制它们的上下。有关如何更改此 notExp2 的详细信息，请参阅notExp2。

不支持链接平滑参数和自适应平滑。

Author(s)

西蒙 N. 伍德[email protected]

References

Breslow,N.E.and Clayton,D.G.(1993)Approximate inference in generalized linear mixed models.美国统计学会杂志》88,9-25。

Lin, X and Zhang, D. (1999) Inference in generalized additive mixed models by using smoothing splines. JRSSB. 55(2):381-400

Pinheiro J.C. and Bates, D.M. (2000) Mixed effects Models in S and S-PLUS. Springer

Ruppert,D.,Wand,M.P.and Carroll,R.J.(2003)Semiparametric Regression.剑桥

Silverman,B.W.(1985)Spline smoothing approach to nonparametric regression的一些方面。JRSSB 47:1-52

Venables, W. N. and Ripley, B. D. (2002) Modern Applied Statistics with S. Fourth edition. Springer.

Wahba, G. (1983) Bayesian confidence intervals for the cross validated smoothing spline. JRSSB 45:133-150

Wood, S.N. (2004) Stable and efficient multiple smoothing parameter estimation for generalized additive models. Journal of the American Statistical Association. 99:673-686

Wood, S.N. (2003) Thin plate regression splines. J.R.Statist.Soc.B 65(1):95-114

Wood,S.N.(2006a)Low rank scale invariant tensor product smooths for generalized additive mixed models.生物统计学》62(4):1025-1036

Wood S.N. (2006b) Generalized Additive Models: An Introduction with R. Chapman and Hall/CRC Press.

Wang, Y. (1998) Mixed effects smoothing spline analysis of variance. J.R. Statist. Soc. B 60, 159-174

https://www.maths.ed.ac.uk/~swood34/

R

R

今日新闻

推荐新闻