1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

高考试卷难度大更公平还是难度小更公平?

本帖由 漂亮的石头2016-02-03 发布。版面名称:知乎日报

  1. 漂亮的石头

    漂亮的石头 版主 管理成员

    注册:
    2012-02-10
    帖子:
    487,766
    赞:
    47
    [​IMG] 知乎用户,心理测量与评价方向、项目反应理论研修中

    首先我们来给公平进行一下定义,私认为“公平”就是指测验能够测量出个体的真实水平。但是,不同的选拔,侧重点也是不同的,主要是看你的目的。区分度和难度,都不是问题的关键,只不过是为了达到目的的手段。再者,难度和区分度并不是捆绑在一起的概念,并不是难度大区分度就大,关键看测验的目标人群,脱离目的谈难度区分度是没有意义的。

    心理测量学上将选拔大致分为标准参照测验和常模参照测验两种。

    常模参照测验的主要目的类似题目所说的公平,这个测验是为了判断被试在整体中的位置。也就是说,不管你的能力是高是低,测验都能比较准确的测量出你的真实能力。所以为了这个目的,题目必须有难的题目,也有简单的题目,并且题目难度分布应该与目标人群能力分布近似。此时,不论是难的题目还是简单的题目,都应该具有中等程度的区分度,也就是在各个能力水平上都能对个体进行一定的区分,而不是聚焦于某个特定的能力水平。

    而标准参照测验的主要目的就是选拔出满足一定标准的个体了。这时测验的重点主要是区分出在所定标准附近的个体。比如某个测验的及格线是60,但是因为误差等原因,得了60分的个体实际能力并没有达到要求,反而能达到要求的个体才得了59分。为了避免这种情况发生,标准参照测验的解决方法是设置大量难度与目标水平相符、且区分度很大的题目。

    而高考统考应该属于常模参照测验,因为统考不需要具体的能力要求,目的是测量学生在整体中的相对位置。(所以有具体能力要求的学校一般可能会采取自主命题,这样才能更有针对性)此时,高考题目难度与当年参加考试的学生能力分布相仿时,可以说试题是公平的。葛军出的那些超高难度的题,更像是标准参照测验的题目,目标人群是能力非常强的学生。但如果这些超高难度的题目数量,与学生能力水平分布所能接受的数量不符,那么可以说这次测试是不公平的。

    以上均基于经典测量理论,同一省份、或统考所使用的测验试卷是相同的。如果使用项目反应理论(如计算机自适应测验)来进行高考更加公平,此处就按下不表了。

    阅读原文
     
正在加载...