- 相關推薦
談歷史學科的考試評價標準
考試的評價就是對考試的質量進行檢測。通常,人們是以對試卷、試題的定性分析和定量分析的方法進行 檢測。定性分析主要是以定量分析的數(shù)據(jù)為依據(jù),對試卷、試題的整體面貌進行描述,它最終應回答:“考試 結果反映命題意圖實現(xiàn)的程度”、“命題意圖反映高考功能實現(xiàn)的程度”這兩個問題。定量分析主要是在對試 卷進行抽樣統(tǒng)計的基礎上,通過信度、效度、區(qū)分度、難度等指標對試卷、試題進行多角度的量化描述。為了便于說明問題,在這里我們把定性和定量分析的內容改編為一種評價標準,并按當前歷史科考試的構 成分為試卷、試題、評分三個部分。
一、試卷
一、試卷設計體現(xiàn)《歷史科考試說明》的各項要求。
《考試說明》是依據(jù)《教學大綱》制定的,它和大綱不同的地方是對考試的一些技術性問題和實施問題做 了規(guī)定。這主要是:考試的能力要求;考試形式及試卷結構,其中包括考試的方式和時間、試卷的分類、考試 內容的比例和題型的比例;考試的知識范圍。
《考試說明》是聯(lián)系《教學大綱》和考試的紐帶,在標準化考試的各個環(huán)節(jié)中,《考試說明》集中體現(xiàn)了 標準化考試的透明度要求,也是用以評價試卷、試題的主要標準之一。
二、考查歷史學科的主體內容
所謂主體內容一是指中學教學的重點內容?荚嚨膬热菀徒虒W的內容一致,更要和教學的主體內容一致 ,不然,考試就失去了它的有效性。其實,所謂主體內容,在《教學大綱》中有透徹的解釋,歸納起來就是: 反映歷史整體面貌和發(fā)展線索的內容;反映歷史演變規(guī)律的內容;反映辯證唯物主義和歷史唯物主義的基本理 論和方法的內容;反映國情的內容。
另外,主體內容亦指與大學學習相關密切的內容。這部分內容是指建立在主體知識之上的與大學學習相關 密切的學科理論和能力方面的內容,即指對歷史事物和歷史現(xiàn)象的綜合、分析、評價的能力。
三、反映學科的內部聯(lián)系和基本規(guī)律
這實際上是對試題科學性的總要求。所謂學科的內部聯(lián)系有兩層含義,一是體現(xiàn)歷史事物、歷史現(xiàn)象之間 的本質關系,不能孤立地考查知識點,不能片面地、錯誤地解釋歷史事實。二是試卷內容對學科各部分內容的 考查要有整體性,也就是說堅持合理的內容比例,這個比例一旦失調,內部聯(lián)系也就難以全面地反映出來。所 謂基本規(guī)律,是指試題的設計要以辯證唯物主義和歷史唯物主義為指導,引導考生通過歷史現(xiàn)象認識人類社會 發(fā)展的客觀規(guī)律。
四、全面考查學科的各種能力要求
現(xiàn)在公布的歷史學科能力共有十項要求,其中第一、二項是識記、理解的要求,做為最基礎的能力要求是 肯定要考到的。三、四、五項是對歷史材料和歷史信息的處理能力,由于材料題的數(shù)量有限,不可能針對每一 項能力要求出一道題,只能是綜合性地設計題目內容,把能力要求包含進去。六、七、八、九項是敘述、分析 、綜合、評價能力的要求,也做綜合性處理。
五、題目難、中、易比例合適,總體難度得到有效控制。
題目難度的控制有這樣幾層含義:其一,大部分的題目難易程度應該在0.3-0.7之間,這個幅度里 的題目,其難易程度又應相對集中在0.5這個區(qū)域里。其二,全卷題目難度應該難、中、易交替出現(xiàn),逐級 由易到難。從我們的試題安排上可以看出,先是選擇題,中間是材料題,最后才是問答題。在每一部分中,難 、中、易不是呈扎堆狀態(tài),而是交替分布。這樣,全卷的總體難度才能得到有效控制。
難度是一個相對的概念,通常人們認為0.5-06之間是合適的區(qū)域。當然,如果需要,也可上下調整 到其它區(qū)域。
六、試卷長度合適
試卷長度是指試題的數(shù)量和參考答案的文字總量之合,試卷過長或過短都會影響考試的信度。在目前的高 考中,在規(guī)定的時間內在50%以上的考生完成全卷內容,這個長度就是合適的。從現(xiàn)在的情況看,試卷長度 是比較合適的,有的考生做完全卷后尚有時間檢查。
二、試題
一、測試目標明確
任何題目的設計都要體現(xiàn)具體測試目標,這樣才能夠有效地限制題目的隨意性,達到規(guī)范化和標準化。歷 史學科的測試目標大致可分為幾類,一是對知識內容掌握的準確程度;二是對知識內容掌握的深入程度;三是 對歷史事物內部聯(lián)系的認識程度;四是理論與史實相結合的水準,五是歷史意識。在這五類目標范圍內又可以 分為許多小的類目。在實際操作中,一道題目往往含有一個以上的測試目標,但幾個測試目標在題目中不能平 分秋色,要有主次之分。
二、試題科學、規(guī)范
試題不能出現(xiàn)科學性的錯誤。有些問題雖然不能算作錯誤,但它存在爭議,遇上這類問題應相當慎重。另 外,試題的科學也表現(xiàn)在題干和參考答案的對應,題目的測試目的,它所涉及的知識范圍等等,都必須在參考 答案中有相應的表述,其層次、范圍、幅度就都是一致的。不能題干龐大,而答案很窄,也不能題干要求很少 但答案要求很多。
規(guī)范的含義是題目的設計要符合歷史學科的特點;在表述上有相對固定的形式;在格式和語言的運用上符 合國家規(guī)定的標準。
三、題目角度新穎,立意深刻
在就要求題目的創(chuàng)設應不句泥于教材的表述,設置新的情境,從新的角度提出問題,這樣的題目往往都含 有較深的立意。如把焚書坑儒和八股取士相聯(lián)系論述問題,這自然就要求從這兩個歷史現(xiàn)象之間的內在聯(lián)系上 尋找一個共同角度去展開。把榷場和民族關系相結合也反映了這樣的問題創(chuàng)設新的情境,是測量對已有知識掌 握程序的最有效的辦法。
四、題意明確,表述方式合理
考試當中有時會出現(xiàn)因題意不明或由于考生對題目的表述不理解而出現(xiàn)了審題錯誤,這是造成誤差的一個 原因。
題意明確首先是命題者對題目所涉及的知識內容準確掌握,其次是對測試目標有準確理解,再是對知識內 容和測試目標之間的關系準確把握。題目的表述方式應該選擇最簡潔、有效的書面語言。
五、題目類型和題型比例合理。
題目類型比例是指主觀題和客觀題的比例。目前歷史科高考試卷主、客觀題的比例是各占50%。在客觀 題尚未發(fā)掘出更好的測量辦法的情況下,這個比例是合適的。大多數(shù)的考生往往是在主觀題這一部分拉開檔次 。題型比例是指各類題型所占的比重。前邊我們已經(jīng)提到選擇題、填空題、材料題、問答題的比例,它們基本 上呈金字塔形狀,這種形狀是為了有效地實現(xiàn)考試目的。它一方面反映了對基礎知識的重視,另一方面反映了 對學科能力的要求。這種狀況在目前情況下能夠較好地區(qū)分考生。
六、有較好的區(qū)分度
區(qū)分度指試題對不同水平考生的鑒別能力,對于區(qū)分度的掌握,有從整體上看的,也有從局部上看的,亦 有從一道試題上看的。從整體上看,全卷的區(qū)分度應該在0.3以上,說明試卷整體的鑒別能力較好。全卷區(qū) 分度好不等于要求每道題都在0.3上,但在考查主要學科能力的試題上或綜合性較強的試題上要求有較高的 區(qū)分度,這類試題往往是材料解析題、問答題和部分選擇題。在這些題目中,區(qū)分度的要求也是不同的,它們 之中亦有很高、較高之分?傊瑓^(qū)分度也有一個根據(jù)命題意圖合理布局的問題。
區(qū)分度和難度有著密切的關系,太難、太易的題目都不會有好的區(qū)分度,只有中等難度的題目才會產生好 的區(qū)分度。根據(jù)這一原理,目前歷史科考試中的問答題里出現(xiàn)了考查再認、再現(xiàn)能力和分析、綜合、評價能力 相結合的形式,使題目達到一種不難不易的狀況,以求達到好的區(qū)分度。當然,問答題最理想的設計還是從思 維的角度劃分層次,這樣能充分利用題型的功能。
以上是對于各種試題總的評價目標,但具體到不同類型的試題,也有不同的要求:
[客觀題]
一、試題內容適合使用選擇題
從理論上說,選擇題應該可以考查各種內容和能力要求,但目前對于選擇題的功能尚未完全發(fā)掘出來,也 由于受到試卷長度的限制,所以有的內容不適于選擇題使用。比如考查敘述、論證、對歷史材料中所含有效信 息的篩選等,在選擇題中難以實施,尤其是涉及理論的內容,弄不好就會形成模式化、概念化的東西。這幾年 ,實際上用于選擇題方面的內容在不斷擴大,由最初的考查再認、再現(xiàn)能力的內容,擴大到理解、分析、綜合 甚至評價的內容。選擇題的發(fā)展方向是在發(fā)掘題目多樣化的同時注重考查歷史思維水平。
二、題干圍繞一個中心,選項和題干的關系一致
題干圍繞一個中心,首先,題干必須有一個相對完整的中心問題,不能將題干要表達的意思放到選項中去 。其次,題干不能產生歧意。選項和題干的關系一致是指選項和題干圍繞一個共同的問題,不能出現(xiàn)與題干所 問無關的選項。
三、干擾項有效
干擾項有效是指對正確項的干擾有效。一道選擇題出的是否成功,除了正確項無誤外,干擾項也相當重要 ,因為它起到了調節(jié)試題難度的作用。如果干擾項不起干擾作用,易被學生排除,試題難度就會下降,因為學 生不用對正確項進行分析,只憑排除錯誤項即可做答,這樣,不僅難度下降,區(qū)分度也會隨之下降。所以,干 擾有效也存在一個程度問題。這個程度的控制標準就是使試題達到中等難度為最合適。如何使干擾項有效呢? 一是干擾項和正確項對試題題干的關系應該一致,這個在前邊也講過;二是干擾項應該代表考生的典型錯誤, 否則,就會出現(xiàn)干擾項太易或大部分考生把某一干擾項做為正確項的情況。這樣,考試的有效程度就會降低, 在選拔性考試中,這一點顯得尤為重要。
四、各選項的結構、長度大體一致
這實際上是要求各選項要整齊。結構是說句式、用詞、語氣要大體一致,不能出現(xiàn)迥然不同的表述,這樣 容易帶來某種暗示,或者引起評分上的分歧。長度是說文字長度要大體一致,一般來說,選項的文字不宜過長 。如果文字不長不足以表述一個相對完整的意思,那么就要考慮重新設計題目內容。
五、正確選項比例分布合理
從總題量的角度說,正確項應該大致均勻地分布在四個選項中,這會降低猜題、蒙題的可能,提高考試效 果。在多選題當中,正確項存在一個比例問題,原則上正確項不能集中在某一數(shù)量上,也要有所分布,同時分 布要均勻。
[主觀題]
一、題目設計體現(xiàn)運用已有知識解決新問題的能力考查要求
運用已有知識解決新問題的能力是對學科能力要求的一個概括性表述。它體現(xiàn)在試題設計上應該包含這樣 幾層意思:其一,題目涉及的內容在教材中有依托。其二,題目要設計成不同于教材表述的新情境。其三,題 目要引導考生對歷史現(xiàn)象進行新的認識。
這里邊第二條最不容易做得好。因為新情境的設計首先受到教材的制約,往往是新情境同時也會帶來許多 的新的內容,如果這些內容在教材中沒有涉及到,就要進行修改、剪裁,弄不好會給人以削足適履之感,有時 甚至會失去新情境的意義。在歷史學科中,所謂新情境實際上就是人們認識歷史現(xiàn)象的新角度或展示的新材料 。這些東西不是文學創(chuàng)作,可以由命題者去編制,它必須來源于既有的材料和現(xiàn)實中人們在研究歷史現(xiàn)象時所 認識到的那些問題以及認識角度,它的規(guī)定性很強,要恰當?shù)匕阉鼈兏脑斐梢环N新情境并與考生已有知識對接 ,這實際上是一種特殊的創(chuàng)造性勞動,做到天衣無縫相當不容易。當然,這并不意味著新情境都會帶來新角度 ,命題者不能一味單純求新,關鍵還是要看新情境有沒有一定的深度,它自身的認識價值如何。這也是我們評 價問答題時應注意的一個問題。
二、考查較高層次的學科能力
歷史學科十項能力要求中,涉及對歷史材料的分析運用能力、論證能力、評價歷史事件、歷史人物的能力 應該是較高層次的學科能力。這幾方面的能力有些共同特點,一是理論水平要求高,二是對歷史材料和信息的 處理水平要求高,三是對文字表述水平要求高,總的來說,較高層次的能力要求綜合性強。
較高層次的學科能力是以較低層次的學科能力為其基礎的。在主觀題的設計中,命題者很注意由較低層次 向較高層次的深入梯度,也就是說,涉及再認、再現(xiàn)歷史事實、敘述、理解的能力要求在主觀題中仍占有一定 的份量,所以,確切地說應該是重點考查較高層次的學科能力。
三、難度和答題量與賦分值合理
賦分值是指題目在全卷總分當中的比值。歷史學科四種題型的賦分值不同,從每道題來說,填空題0.5 分;選擇題1分、2分;材料解析題9分左右;問答題12分左右,由此可以看出,賦分值是隨著試題的難度 和答題量的增長而增長的。那么,對于賦分值與難度、答題量的關系的含義就應該這樣認識:賦分值是考試內 容含量的顯示,它反映支付思維活動和文字表述活動的程度。難度和答題量的控制依據(jù)是賦分的比值。
但是這里邊有兩個問題需要注意,一是賦分值和難度、答題量的關系在同一題型內是相對整齊的,但不同 題型相比較就復雜一些,比如十個1分的選擇題和一個10分的問答題的比較只能是大致整齊。在主觀題中, 應特別注意分數(shù)的分布和難度、答題量的比重。比重應體現(xiàn)能力考查的要求,應體現(xiàn)對學科深層含義的理解。 二是主觀題的難度相對地比客觀題的難度要高一些,不能用整卷的平均難度值去衡量主觀題的難度。另外,主 觀題的難度和答題量關系要具體而論,通常,涉及再認、再現(xiàn)歷史事實的內容,即使文字量多,但難度不高, 賦分也較少;涉及綜合、分析、評價的內容,即使文字量不多,但難度較高,賦分也多一些。
三、評分
一、參考答案及評分標準具有科學性和可操作性
科學性是指參考答案和評分標準無科學性錯誤,另外,亦指程度合適。對于選擇題來說,答案就是正確選 項,在設計正確選項時就要考慮到它的科學性和程度問題。程度包含難度,也包含其它的因素,如應排除正確 選項的偏、怪現(xiàn)象以及它和干擾項的內容是否平衡等等。
對于主觀題來說,科學性首先是指參考答案和評分標準科學合理。另外,重要的是要看參考答案是否體現(xiàn) 了一個相對完整的科學含義,是否揭示了題目各個因素之間的內部聯(lián)系。可操作性是指評分標準應與參考答案 相呼應,相一致,同時又有一定程度的變通性,也就是說,評分標準對答案來說既是給分的依據(jù)又是變通的依 據(jù)。這要求評分標準的含量要大于具體的答案,要能放得開又能鎖得住?傊,評分標準應能夠應付對同一問 題的各種理解的表述。
二、主觀題評分既能有效地控制評分誤差,又能鼓勵考生有創(chuàng)見地答題
控制評分誤差和鼓勵有創(chuàng)見地答題是一對矛盾。控制評分誤差是要求在評分中盡可能具體地設想考生的各 種思路,并在評分中予以規(guī)定;鼓勵有創(chuàng)見地答題則要求題目是開放性的,但題目的開放會給評分的實施中自 然顯得不好操作,變通無依據(jù)。題目越開放,評分誤差就越難以控制,這是各科考試中遇到的普遍問題。因此 ,這條評價標準只能是相對而言,我們只能從題目在多大程度上鼓勵了考生有創(chuàng)見地答案,在評分中是否相應 地采取了控制誤差的方法,這就是說,題目向前發(fā)展了一步,評分也要向前發(fā)展一步,二者應該是相輔相成的 。
就歷史學科來說,控制評分誤差有幾個環(huán)節(jié)應該抓;其一,題目的考查目標要在評分中體現(xiàn)出來;其二 ,考查目標應被分解成得分等級,每一等級應概括考生中的幾種答題情況;考查目標的主體內容應分布各得分 等級中,主體內容是決定基本分的主要依據(jù)。其三,構成答題的其它因素如文字表述的邏輯聯(lián)系,對問題的展 開程度、歷史材料的運用等等也應制定量表予以等級化。
鼓勵考生有創(chuàng)見地答題對題目的要求大致是這樣的,它應該擺脫生硬的一問一答的模式,題目的面貌基本 上不是在提出什么需要回答的問題,而是提出一個共同討論的問題,這樣才談得上“鼓勵”!坝袆(chuàng)見”對于 題目來說,就是材料的組織更巧、問題的切入更新,使考生對已有知識能有新的組合發(fā)揮才可能“有創(chuàng)見”, 也就是說,要把教材套在題目上是無路可走的,非得“創(chuàng)見”一點不可。當然,對于各種“創(chuàng)見”的可能性, 要給以充分估計,并體現(xiàn)在評分標準上,以免評分失去依據(jù)。
【談歷史學科的考試評價標準】相關文章:
也談學科整合08-17
談歷史材料的問題設計08-22
自我評價的標準06-03
談語文學科的審美教育08-08
談新課程標準的“新”05-31
談歷史教學中的設疑08-07
談電視戲曲的歷史和現(xiàn)狀08-05