《如何用R作语言学研究:数据探索与统计分析》评介

您所在的位置:网站首页 parameters语言学 《如何用R作语言学研究:数据探索与统计分析》评介

《如何用R作语言学研究:数据探索与统计分析》评介

2023-11-16 08:49| 来源: 网络整理| 查看: 265

第三部分篇幅最大,包含10个章节,主要探讨假设检验和衡量效应值的方法。第5章关注两组样本的平均数差异检验,包括t检验、Wilcoxon检验和Mann-Whiteney检验。本章详细列举了各类检验需要满足的条件,指出研究者需视情况选取合适的检验方法。第6章解释线性相关分析的原理,探索两个定量变量之间的关系。相关分析大致步骤如下:整理数据并图示化,了解变量间的大体关系;计算相关系数,考量相关程度的强弱;检验相关的显著性,即进行相关系数的假设检验。第7章承上启下,深入探讨线性回归分析。本章讨论的重点是多元线性回归建模、结果解读和模型拟合优度测试。线性回归建模一方面能够确立和解释一个因变量(须为定量变量)和一个或多个自变量(可为定量或定性变量)之间的定量关系,揭示自变量间的交互关系;另一方面利用求得的回归方程式,能够预测新数据可能产生的结果。其他重要内容包括线性回归建模需满足的条件、自变量的选择、极端值的检测和处理等。最后,基于自抽样的回归分析等非参数回归模型,能够应对线性回归分析条件得不到满足时的情况。第8章主题为实验语言学中广泛使用的方差分析,它考察不同组别之间的差异。本章着重介绍了独立单因素方差分析、独立多因素方差分析、重复测量方差分析和混合方差分析。作者指出,方差分析同样需要满足某些特定条件,通过事后检验,它可以帮助研究者发现存在显著差异的具体组别。第9章讨论两个分类变量之间的关联强度,其量化方式有比值比、克拉默V系数(Cramér’s V)和ϕ系数,即所谓的效应值。衡量关联强度显著性可借助卡方检验和Fisher精确检验。第10章将关联分析应用到词汇搭配分析和构式搭配分析。作者介绍了词汇与其他语言结构间关联性的量化和图示化方式。第11章着重讨论了区别性词位分析法,它属于构式搭配分析法的范畴。此分析法通过统计方法确定构式的区别性词位,从而对比两个或多个近义构式。第12和13章分别介绍二元和多元逻辑斯蒂回归建模、其结果的解读和模型拟合优度评估。与多元线性回归模型不同的是,该方法的因变量为二元或多元分布的分类变量,在多元概率语法和词汇(multifactorial probabilistic grammar and lexicology)研究中得到广泛应用。第14章介绍两种非参数回归和分类模型——条件推断决策树和随机森林。当自变量间存在复杂的交互关系,或者样本规模较小但自变量数目较多时,这两种方法可以发挥作用。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3