考试的测量学基础知识（十）：标定

您所在的位置：网站首页 › pna表的标定方法 › 考试的测量学基础知识（十）：标定

考试的测量学基础知识（十）：标定

2023-04-08 14:01| 来源: 网络整理| 查看: 265

原标题：考试的测量学基础知识（十）：标定

标定（Scaling）也译作量表化，是教育测量中最基础的概念之一，至今已有约100年的历史，其下已发展出多个子类别，最初被人们称为“创建可比较分数的方法”（Methods for Creating Comparable Scores）。

在教育测量中，测量的目的往往是比较某特定领域中的考生之间表现的差异，或者考生与一定标准之间的差异。然而这种差异的比较往往依赖一定的度量单位系统。标定指的就是建立统一的具有可比性和参照性的度量系统的过程。根据Kolen（2004）的定义，标定是将数字或其他有序指标与考生在教育测验上的表现建立联系的过程。引入这些数字和有序指标，意在反映考生成绩或能力不断递增的水平。

标定的过程将产生分数量表（Score Scale）和量表分数（Scale Scores），分数量表好比一把米尺，量表分数好比米尺上的具体刻度值。简单地理解就是，标定是将学生原始分数转换到另一个分数量表上的过程。如果没有额外信息，原始分数很难解释。量表分可以为解释测试分数提供简便的途径。一旦转换得到量表分，同时测试使用者熟悉了量表，只要根据量表分，测试使用者就能知道考生的表现如何。

通常在三种情况下需要进行分数标定：新开发的考试或者评价项目；测试的参照群体发生了变化；测试内容发生了较大变化。

根据两个或两个以上的测验是否测量不同的构想（Construct）、是否施测于共同总体，标定可细分为组标定（Battery Scaling）、锚标定（Anchor Scaling）、垂直标定（Vertical Scaling）等。当同一群体的考生接受两个或多个测量构念不同的考试时，可以利用这批考生将每项考试的分数转换到一个共同的分布上，以使分数可比较，即为组标定。例如，在参加高考时，同一批考生可能会参加语文、数学、英语、物理、化学、生物等多学科的考试，每个学科的考试测量的都是不同的构念，此时就可以通过成套标定的方法建立各学科间的连接，标定后的分数可以直接比较。若不同群体的考生接受两个或多个测量构念不同的考试，则需这些考生接受共同的测量（锚测量），并采用锚标定的方法来解决标定问题。也有很多测量构念是相同或相近的等级考试，通过试题难度的不同来判断不同考生群体是否达到相应的等级。这时，可以采用垂直标定将不同级别的考试上的得分转换到一个共同的量尺上。例如，全国英语等级水平考试（PETS）有多个级别，通过垂直标定建立了一个统一的分数量表，并确定了不同级别的能力值。

供稿：关丹丹返回搜狐，查看更多

责任编辑：

【本文地址】

考试的测量学基础知识（十）：标定

考试的测量学基础知识（十）：标定

今日新闻

推荐新闻