期末考试,老师们都特别关心那一纸试卷。考前会猜测出卷人大概出什么样的题目;考后会议论题目的质量如何——太简单了,不满意;太难了,不满意;所考非所学,更不满意;满意的时候,很少。
如今,减负已经走到了取消区域统考这一步,试卷依然是老师们关心的重点,因为取消区域统考,不等于取消考试。如历年期末考试季一样,最近网上又有关于“海淀”小学期末考试题的讨论,主题依然主打一个“卷”字——什么题目灵活啊,注重思维能力啊,难度大啊,还有题量惊人啊等等,制造和贩卖的都是“焦虑”。的确,笔者也遇到了五、六年级语文八页试卷、两个小时的大题量,把学生考得直骂娘的。
有人给出正面评价,说灵活才能考出素养,难度大才能考出能力,题量惊人才能趁早适应温儒敏教授提出的让15%的考生做不完高考题……
有人给出负面评价,说小学阶段,灵活度、难度、题量都应该适中,考试不仅是检测一学期教与学的质量,也应该让大多数学生通过考试更多地看见自己的进步,获得成就感和信心……
最后,都会聚焦一个话题:到底什么样的试卷才是值得肯定的?
试卷呈现出什么样子,是由命题人决定的。命题人专业,则试卷质量有保障;试卷问题多多,大概率是命题人不专业。不专业的人干专业活,肯定会干得糊里糊涂。
简单地说,命题是个专业活。专业的人,干专业的活,并把活真正干得专业,自然就经得住推敲和评点。
关于命题,新课标在“学业水平考试”中专门提出了要求——根据课标的表述,日常每个年级的期末考试,并不算“学业水平考试”,但,既然同是“考试”,同是为了检验学生核心素养发展的水平,同是为改进教与学服务的,那么,在“命题原则”“命题规划”“命题要求”上,应该是一致的。
课标提出了三条命题原则:素养立意,依标命题,科学规范。
命题规划上,有这样的表述:“科学设计试卷结构,明确规定主观性和客观性试题的比例,倡导设计基于情境的探究性、开放性、综合性试题。对题型设计、题量和难度、评分标准等方面提出基本要求,充分展现学生在语文学习过程中形成的能力、方法,以及情感态度与价值观的综合发展情况。”这段表述中,明确要求命题人要明确“题型设计、题量和难度”等方面的基本要求。
“基本要求”是什么呢?课标在“命题要求”中有关于情境、材料等方面的表述,但没有直接提出关于“信度”和“效度”的要求——命题人的专业知识、能力还需要有更专业的学习和实践打底。
笔者在读中师的时候,就知道了一份高质量的试卷,应该是既具信度又具效度的。
试卷的信度和效度是衡量试卷质量的两大核心指标,二者相辅相成,效度是试卷的核心价值,信度是效度的前提和保障,一份优质的试卷必须同时满足信度和效度的要求。
什么是信度呢?信度指试卷测试结果的一致性、稳定性和可靠性,简单来说,就是同一批学生在不同时间、不同场景下做同一份试卷(或等值试卷),得到的分数结果是否基本一致。如果分数波动极小,说明试卷信度高;若分数忽高忽低,说明试卷的测量结果不可靠,信度低。也可以说,信度指的是考试结果与学生平时学习表现基本是一致的,不会出现平时学习表现优秀的考得一塌糊涂,平时学习表现较差的却“一鸣惊人”的情况。
什么是效度呢?效度指试卷对所要测量的教学目标、知识能力的准确程度和有效程度,简单来说,就是试卷“考的是不是想要考的内容”“考的内容能不能反映学生的真实水平”。如果试卷精准测到了目标知识/能力,说明效度高;若考的内容与教学目标脱节,就是效度低。
一份六年级上学期期末试卷中的整本书阅读,出现了对《闪闪的红星》的考察,显然在效度上就出了问题;一份五年级的试卷,大多数学生两个小时也很难完成,信度就值得怀疑。
明白了什么是信度,什么是效度,对一份试卷的质量就能做出比较专业中肯的评价了。不仅如此,我们还能自己试着命题出卷了。更重要的是,一线教师能够对一份试卷进行专业评判,就不应该为考试成绩焦虑了——如果一份既有信度又有效度的试卷让自己感到挫败,一定是自己的教学真的有些失败了;如果试卷本身在信度和效度上有问题,成绩也就没有什么参考意义了。
当然,命题人(一般是教研员)更要对自己设计的试卷有专业的自我判断和认知。