高考试卷难度大更公平还是难度小更公平？

漂亮的石头 · 2016-02-03

知乎用户，心理测量与评价方向、项目反应理论研修中

首先我们来给公平进行一下定义，私认为“公平”就是指测验能够测量出个体的真实水平。但是，不同的选拔，侧重点也是不同的，主要是看你的目的。区分度和难度，都不是问题的关键，只不过是为了达到目的的手段。再者，难度和区分度并不是捆绑在一起的概念，并不是难度大区分度就大，关键看测验的目标人群，脱离目的谈难度区分度是没有意义的。

心理测量学上将选拔大致分为标准参照测验和常模参照测验两种。

常模参照测验的主要目的类似题目所说的公平，这个测验是为了判断被试在整体中的位置。也就是说，不管你的能力是高是低，测验都能比较准确的测量出你的真实能力。所以为了这个目的，题目必须有难的题目，也有简单的题目，并且题目难度分布应该与目标人群能力分布近似。此时，不论是难的题目还是简单的题目，都应该具有中等程度的区分度，也就是在各个能力水平上都能对个体进行一定的区分，而不是聚焦于某个特定的能力水平。

而标准参照测验的主要目的就是选拔出满足一定标准的个体了。这时测验的重点主要是区分出在所定标准附近的个体。比如某个测验的及格线是60，但是因为误差等原因，得了60分的个体实际能力并没有达到要求，反而能达到要求的个体才得了59分。为了避免这种情况发生，标准参照测验的解决方法是设置大量难度与目标水平相符、且区分度很大的题目。

而高考统考应该属于常模参照测验，因为统考不需要具体的能力要求，目的是测量学生在整体中的相对位置。（所以有具体能力要求的学校一般可能会采取自主命题，这样才能更有针对性）此时，高考题目难度与当年参加考试的学生能力分布相仿时，可以说试题是公平的。葛军出的那些超高难度的题，更像是标准参照测验的题目，目标人群是能力非常强的学生。但如果这些超高难度的题目数量，与学生能力水平分布所能接受的数量不符，那么可以说这次测试是不公平的。

以上均基于经典测量理论，同一省份、或统考所使用的测验试卷是相同的。如果使用项目反应理论（如计算机自适应测验）来进行高考更加公平，此处就按下不表了。

阅读原文

登录或注册

高考试卷难度大更公平还是难度小更公平？

漂亮的石头版主管理成员

登录或注册

高考试卷难度大更公平还是难度小更公平？

漂亮的石头 版主 管理成员

漂亮的石头版主管理成员