新都网

高考

新都网>教育>高考>正文

关于命制选拔考试试题的思考(一)

http://www.newdu.com 参加讨论 2018/12/3


    关于命制选拔考试试题的思考(一)
    ──高考历史选择题的命制
    湖北省宜昌市教研中心 李明海
湖北省宜昌市第二中学 雷勇军
湖北省宜都市一中 姜宏益
    
    随着1950年代标准化考试的需要而出现的选择试题,1982年被正式地引进了我国历史高考,到1989年就独占了“卷I”,达到了50%的比分。历史高考选择题历经多种结构形式或组成方式的改革演变,逐渐定型于以材料为主的四选一的选择题。选择题,特别是以材料为主的选择题,在相当程度上不仅能够取代古老的填空题、连线题、判断题等题型的考查功能,还能在一定程度上考查历史的理解能力、分析概括能力等,较之于这些题型,其先进性是无疑的。但是,任何题型都有其自身的局限性,选择题型,即使是材料选择题型也不例外。根据现行高考历史选择题,其局限性主要表现在两个大的方面,一是“先天”局限性,二是“后天”局限性。
    一、“先天”局限性
    1.暴露了25%的答案
    现行的高考历史选择题,是四选一的“单选”题,即答案必定是四个选项中的一个。从概率学的角度说,即使不学历史,也能做对25%。高考是选拔考试,是要通过这一考试为高校选拔可以继续深造的人材。也就是说,通过这种选择题而选拔出来的人材中,至少有25%的分数是不真实的,或者说,至少有25%的人材可能不是高校所需要的人材。现在的选择题占全卷总分的48%,根据上述推算,考试分数的失真率至少也有12%左右。
    现行历史高考选择题的答案25%暴露于外,是这一题型的先天局限性。仅从这一角度看,填空题是没有这一局限的。
    2.只考结果不考过程
    以材料为主的选择题,虽然在一定程度上可以考查考生的历史理解、历史分析、历史概括等能力,但因选项只能是“结果”呈现,因此,其所考查的也只能是考生“理解”、“分析”、“概括”的结果而不可能是其过程。而恰恰是这一思维“过程”,才能更真实地反映考生的能力和综合素质,反映考生之间的差别。根据笔者的调查,宜昌市的一所市级重点中学中,做对的学生中有近1/3的思路、理由是不同的,甚至相反;同错一处的学生中,则有2/5以上的想法不一样。所以,高校由此选拔的人材,到底属于什么类型,更适合读什么专业,有什么潜能等,是不清楚的。
    选择题的问答方式,决定了这一考查的先天局限性(现行历史高考中的材料问答题,在一定程度上是可以考查考生的思维过程的,但遗憾的是命题专家们没有很好地做到这一点。这是另一问题,有待另议)。在这一方面,传统的问答题比现今的选择题有更大的优势。
    3.拒绝多样性解释
    单项选择题在四项中只能选一项,但人文学科的特性在相当程度上与自然科学的区别就是解释的多样性。一是同一材料本身就可能包含了多种信息,对此必然生出多种解释;二是即使材料中的信息较为单一,但却会仁者见仁、智者见智。前者如2009年全国高考卷I第22题:19世纪中期的一位英国记者报道:“没有一个曼彻斯特的工人没有钟表,这是他们须臾不可离开的东西……(他们)最通常的物品是那小小的荷兰机械,有一个忙碌的摆,在整个世界面前公开而公正地摆动着。”这一材料表明,当时的曼彻斯特A.钟表工业非常发达 B.工厂纪律严格 C.工人消费水平较高 D.贫富差距缩小。标答是B,不错;但就材料本身而言,选A也说得过去,甚至选C、选D都有一定的道理。正因为如此,所以,选A者达到了22.76%,选C和D者分别也占到了7.46%和5.45%(数据来源于湖北考试院)。后者如2009年全国高考卷I第21题:1787年费城会议制定的《美利坚合众国宪法》规定:合众国不得授予贵族爵位。反映了美国宪法的主要原则是A.民主主义 B.平等主义 C.自由主义 D.共和主义。标答是D,这是命题者所“见”;但绝大多数考生选了B,达63.90%,还有24.09%的考生选A,真选D者仅占9.89%(数据来源于湖北考试院)。正是人文解释具有多样性这一特性,所以部分考生在面对这类试题时不好决断,明明知道多选不选都不能得分,他们却因此多选或不选了。如上述第22题“未选或多选”者占了0.25%,第21题则占了0.23%(数据来源于湖北考试院)。
    单项选择题的题型结构,拒绝对材料解释的多样性,这一局限的先天性虽然不像上述两点那么突出,但高校因此将一批解释正确、有能力的考生拒之门外了,这一点与上述两点的“选拔功能”缺陷是等同的。较为早期的多项选择题,2005年全国卷I还存在着的组合式选择题(当时组合式选择题的思维要求主要是记忆),在一定程度上能够克服这一局限。
    二、“后天”局限性
    选择题的天然局限性,命题专家们还是知道的,所以才有近30年来对选择题表现方式的不断变革,即变革为我们现今所见到的以材料为主的单项选择题。这一变革无疑取得了成效,也推动了高中历史教育教学的进一步发展。但不可否认的是,针对其“先天”局限性,命题专家的“克服”工作还做得不够,还存在着明显的“后天”局限性。
    1.题异分同
    自2003年以来,文综全国卷的历史选择试题基本上都是12题;每题4分,共48分。虽然每题分数相同,但题与题是不相同的。一是题干、题肢的文字长度不同,需要考生阅读的时间不同。从选拔的角度看,这是能够考查考生阅读速度的,但因其赋分相同,考生的这一能力差别实际上被忽略了。二是题目之间的能力要求不一,有的重在记忆,有的重在理解,还有的重在分析、重在概括等。考生会做什么题,不会做什么题,是能够区别考生之间能力大小和思维特性的,但因赋分相同,在实际的选拔中却是没有区别的。三是题目的难易不等,有的考生做对了难题而却做错了容易题,而有的考生相反,但他们之间的总分却一样,所以,“选拔”的意义也就没有了。要有利于选拔,就应该是异题异分。
    2.分层、选拔意识弱
    笔者所在的湖北省,高考之后,省考试院就会发布《普通高考成绩与中学学科教学诊断报告》(上述数据就是来源于这一报告。下同)。通过这一报告,我们可以说,命题专家在命题之时,至少说在命制选择题时,分层意识,选拔意识是非常弱的。一是上述所说的“题异分同”,说明命题专家的分层意识和选拔意识弱,甚至可以说没有分层意识,没有选拔意识;二是更主要的:分不出考生考试分数的高下,因为试题区分度非常低,甚至没有区分度。如2009年第21题,宜昌市的夷陵中学(省级重点中学)全校均分0、难度0、标准差0,区分度0。这样的考试结果,无论如何也不可能说命题专家有分层意识和选拔意识。
    全国高校之间是有差别的,既有重点大学与非重点大学之别,也有重金融、重政法、重文史等的不同。因此,这些大学所招收的考生也应该是不同的,在现行高考制度下,至少要能够区别出这些考生的应试能力——分数的高下。因为命题专家们的分层意识和选拔意识弱,使近年来的高考试题,特别是近三年来的全国高考卷I的历史选择题,具体到第一个小题,要易者都做对,要难者都做错,真正难度适中、区分度好的试题太少。因此可以说,高校在此分数段内,并没有真正选拔出自己所需要的人材。
    3.个人因素重
    高考命题专家们,大多来自高校,在各自的研究领域也大多有一定的名气,是各有所专的。面对如此影响千百万人前途命运的工作,相信他们是小心谨慎、高度负责的。但受时代的限制,也受命题规则的限制,现今的高考命题,在具体的操作过程中,还是一种个人的经验行为,因此,他们所命制出来的试题,自然会烙上个人因素。有个人因素并不可怕,只要高校能够从中真正选拔出人材。就近三、四年来的相当部分选择试题看,部分命题专家个人因素的作为与高校选拔人材的需要不是正相关的,如上述0区分度的试题。通过命题专家面对全国学者、专家和部分中学教师对每年高考试题评论的反映看,与高校选拔人材的需要不是正相关的命题专家的个人因素,也好像没有受到应有的组织纪律约束和学术规范约束:一、从来没有看到一个命题专家对无区分度,甚至负区分度的试题道歉,有的则是强词夺理地解释;二、国家考试中心的试题评价报告,就此也看不到多少自责的文字;三、同类问题的试题后来继续出现于高考试题中,说明国家考试中心的领导,并没有将这些命题专家“打入另册”不再使用。(如没有答案的题,在2008年全国卷I第15题——梁启超关于“科学万能说”的议论——中出现了,到 2010年全国卷I第13题——欧阳修要求禁雕版印刷书——中又出现了。另外还有答案错误的题,也一再出现)。
    由于这部分命题专家的个人因素,单项选择题中原本就存在着的天然局限性,不但没有被其后天的努力所弥补,相反,在某些方面反而被强化了、被扩大了,当然,也就更加不利于高校选拔人材了。
    三、改造“卷I”的设想
    单项选择题的先天局限性和后天局限性,使这一题型的选拔功能被大大地打了折扣。正可能基于此,有些省的高考不再使用这一题型了,如江苏省的数学高考试卷中就没有选择题。这是其一;其二,据说纯粹从应试角度出发,仅凭其特有的技巧,就能将高考成绩提高20-30%的各类选择题应试“工具书”,也卖的很红火。鉴于此,如若在高考中仍然要使用这一题型,就必须加于改造。下面是笔者的设想,在此抛砖引玉。
    本设想仍然以现行全国卷文综历史选择题12个题量为距(如若历史单科命题,其题量题分则成正比例增加)。
    1.第12-14题。共3题6分,主要考查考生的记忆能力和较为简单的理解能力。记忆能力是一切思维能力的基础,更是学习历史学科的基础。大量的史实不能准确记忆,谈理解历史、分析历史等,都是空话。但必竟是高考试题,仅停留于单纯记忆的考查,其意义也有局限,因此,增加一定的理解能力要求是必要的。如2000年全国春季高考第4题:下列关于春秋争霸性质的说法,正确的是A.打击奴隶制,推广封建制 B.“尊王攘夷”,维护周王室统治 C.春秋无义战,阻碍社会进步 D.争夺土地人口的兼并战争。D项在历史教科书和史学专著中都有明确表述,所以,此题主要考查记忆能力,但为什么这么说?只有理解了春秋争霸战争性质,才可能牢固地记住D项,而不被A、B、C干扰项所惑。
    因为此类试题难度较低,所以赋分也就相应少些:每题2分。
    具体要求:一是这3道试题的长度要大致相等,文字表达的明白度、顺畅度大致相同;二是题干不使用材料,不考查考生阅读材料的能力。
    2.第15-17题。共3题9分,主要考查考生历史理解能力和一定的分析、概括能力。作为后人,对待历史,最基本的要求是理解,这样才能保证我们对待历史的态度接近客观,才有可能走进较为真实的历史。要真正理解历史,必然需要一定的分析历史和概括历史的能力。所以,作为高考试题,要考查考生的历史理解能力,自然也要带上一定的分析、概括能力,对考生进行考查。如2007全国卷I第22题:20世纪70年代,毛泽东提出“三个世界”划分的理论,主要目的是A.团结第三世界发展中国家,使中国尽早恢复在联合国的合法席位 B.支援第三世界国家人民的反美斗争 C.表明中国是第三世界国家,不与美、苏结盟 D. 团结第二、第三世界国家,反对霸权主义。毛泽东提出“三个世界”理论的目的是什么?这需要理解,且需要结合当时的时代背景才能准确地理解;主要目的是什么?考生还要进一步在四个选项中作比较分析。
    因为此类试题的难度要大于上述的第12-14题,所以赋分也要相对多些。
    具体要求:一是这3个试题的长度和文字表述都要“旗鼓相当”,不少于上述第12-14题的文字长度;二是“理解”的深、广度也要大致相当;三是不能对分析、概括能力作过高要求;四是题干仍然不使用材料,不考查考生阅读材料的能力。
    3.第18-20题。共3题12分,主要考查考生阅读情景材料、理解历史问题的能力和一定的分析、概括能力。阅读情景材料、理解历史问题,是历史学的基本要求。作为为高校选拔人材而编拟的历史试题,不仅是作为历史专业人材的需要,即是作为即将读大学的文科大学生,也应该具备一定的阅读情景材料、理解历史问题的能力。所以,作为高考的历史试题,对考生进行这一考查是十分必要的。虽然选项四者必居其一,大大降低了读懂情景材料、理解历史问题的难度,但要准确把握,没有一定的分析、概括能力也是不行的,因此,自然会将考生的分析问题、概括问题的能力一同进行考查。另外,从试题的可读性方面讲,编撰出形象真实可信的情景材料,也应该是命题者的追求。如2010年全国卷I第15题:1913年,某身着日式服装的革命党人途遇一老农,老农询问其国籍,某称“予中华民国人也”。老农“忽做惊状,似绝不解中华民国为何物者,”当被告知亦为中华民国人时,老农茫然惶然,连声说:“我非革命党,我非中华民国人。”这表明A.国内民众反日情绪强烈 B.革命党人处于不合法状态C.辛亥革命对农村影响有限D.农民阶级不支持辛亥革命。这是编造的一个历史情景,但非常真实。考生如果真正读懂了这则材料,就知道这则材料或这一情景主要在谈辛亥革命的影响,通过一定的分析,就知道正确答案是C;如若考生没有真正读懂这则材料,就可能误入这则材料中的某些“陷阱”或选A(被材料中的“身着日式服装”所“诱”),或选B、D(被材料中的“忽做惊状,似绝不解中华民国为何物者”、 “我非革命党,我非中华民国人”所“诱”)。
    此类试题的难度明显大于上述两类试题的难度,所以赋分也较上述两类试题赋分多。
    具体要求:一、材料不宜过长,各题长度相当;二、情景真实、形象;三、非选项要具有一定的干扰性。
    4.第21-22题。共2题10分,主要考查考生理解历史人物言论或历史学家著述的能力,以及相应把握历史背景的能力。学习历史必然要接触历史人物或历史学家的著述,而接触历史人物最好的办法,理解历史学家著述真意的最好办法,就是直接阅读历史人物的言论和历史学家的著述。所以,近年来的历史高考,出现了大量此类试题。但遗憾的是,命题专家在命制此类试题之时,并没有明确其具体的考查功能,也因此并没有将它作为一个命题类型进行研究。笔者曾经留意过这种试题,也尝试性地进行过研究。2010年四月湖北省六市统一调考,笔者编拟了这样一个试题:某政治家认为,在科尔尼洛夫暴动以前,尽管 “遭到一些挫折和呈现出衰败景象,但俄国仍在坚定不移地走上坡路,正在克服革命的混乱和酝酿新的国家制度。在七月粉碎布尔什维克之后,这个过程向前发展得特别快,然而却被那些诚实的但在政治上过于无知和缺少耐心的将军们的突如其来的疯狂行动打断了”。这个政治家的主旨是A.俄国需要建立“新的国家制度”B.十月革命的成功具有偶然性C.“七月粉碎布尔什维克”后形势好D.肯定“二月革命”后的政府。此题最大的要求是考生能够读懂这位政治家的言论。要想真正读懂这位政治家的言论,必须结合有关十月革命过程的知识,同时,还要具备一定的程度区分能力,否则,此题难做对。(解析此题:这位政治家指责的是那些“将军们”的“疯狂行动打断了”“七月流血事件”之后的“向前发展得特别快”的形势,其后的形势是什么呢?是十月革命。按这位政治家的意思,如若没有这些将军们的“疯狂行动”,当然就没有十月革命。根据本题选项,只能选B)。
    (此题在宜昌市的考试情况:难度0.25,区分度0.14,标准差1.73;各选项得分率A 0.41、B 0.17、C 0.17、D 0.25。就总体看,这一成绩不理想,但从选拔角度,至少有二点值得肯定:一是非选项的干扰性都很强,所选者都超过了10%,符合测量学中的理想值;二是0.14的正区分度,说明更有利于尖子生脱颖而出,更有利于重点高校选拔人材)。
    此类试题,材料属于“原始材料”,较之上述18-20题的情景材料更难于读懂;非选项的干扰性更强,因此其赋分也要比上述18-20题多。
    具体要求:一、各题言论的长度大体相当,隐晦的程度基本一样;二、非选项的干扰性要比较强,一般用程度性语言设问求答。
    5.第23题。共1题7分,主要为避免单项选择题的先天局限性、为考查考生准确把握历史问题的能力、为考查考生历史学习心理品质等设计,姑且定名为“不定项选择题”。
    具体设想如下:一、题干由“原始材料”组成,其难易程度与上述第21-22题相当。二、仍然分设A、B、C、D四个选项,其文字长度基本相等,正选答案也许是一个,也许是两个、三个,也许全是(是不是可以“全不是”,还有待研究)。三、给分要求:错选一项全题无分;选项正确,但只要少选了一项,给5分(因为其材料难度与上述第21-22题相当,非选项的干扰性又不低于第21-22题,所以其能力要求没有低于第21-22题;考生在此能够选出正确项,只是少选了正确项,并没有多选即错选以“碰运气”,证明考生在此能够根据试题要求作答,又有选一项的能力,所以,应该给5分)。这样设计的具体好处是:一、因为是“不定项”的,所以考生就无法用所谓的“排除法”去做题,更无法去“猜”题,从而打消了考生“碰运气”的学习心理,也避免了单选题25%的答案暴露于外的先天局限性。二、更有利于优秀考生。真正读懂了材料,真正理解了设问要求的优秀考生;真正在平常的历史学习过程中养成了实事求是心理品质的优秀考生,必然会根据试题要求,根据自己的理解或选或不选。三、更有利于高校选拔,特别是有利于重点高校的选拔。
    因为“不定项”,其难度即使较之上述第21-22题也是大大增加了,所以,其赋分应该更多。
    上述五点,是对试题构成的设想。
    根据这一设想,选择题仍然是12个题,但总分只有44分了,较之于现今的48分少了4分。这4分加到非选择题中去。因为选择题先天局限性太多,特别是不能考查考生的思维过程,适当减缩选择题的分值比例,可能更有利于高校选拔人材。
    对于试卷成绩的呈现,笔者的设想是:每一考生的成绩相应依次呈现,以保证高校选拔之时有参考依据。如两个考生在选择题上的总分是相同的,但一个考生主要是前面12-20题所得的分,而另一个考生主要是后面21-23题所得的分,说明这两个考生的思维品质和学习能力还是有区别的,就此,也许有些高校更愿意录取前者,也许有些高校更愿意录取后者。
    再好的试题变革设计,也要靠好的制度保证才能有好的实施。上述由易到难的试题结构,在一定程度上可以避免命题专家的随意性和一定的“后天”局限性,但并不能避免命题专家的“个人因素”。要保证有选项的试题一定有选项,要保证有选项的试题一定是公认的正确选项,这不是选择题本身的变革问题,而是选择题的具体编拟问题。选择试题如何具体编拟?则完全由命题专家的“个人因素”所决定。而命题专家的“个人因素”如何决定?则属于国家考试中心的管理问题,或命题小组内部的管理机制问题了。这不是本文所要讨论的话题。
    祝愿我国的高考试题越出越好。
    作者简介:男,1955年5月生,现工作于湖北省宜昌市教育教学研究中心。湖北省特级教师,宜昌市首批正高职教师(“正教授”级中学教师)。中国教育学会历史专业委员会会员、学术委员,湖北省历史学会学术委员会主任,宜昌市教研中心教研员。曾先后撰写、主编了近10部专著,发表了近100篇文章。
    雷勇军,男,1974年生,中学一级教师,湖北省宜昌市第二中学历史教师,湖北省历史学科优秀教师,主要研究中学历史教学。
    姜宏益,湖北省宜都市一中历史教师,教研组长。

栏目导航


触屏版电脑版
Copyright © 2004-2020 Newdu.com All Rights Reserved
京ICP备09058993号