- 相關推薦
論本科教學中題庫建設的意義及質量評價體系
論本科教學中題庫建設的意義及質量評價體系
陳晟1,江昀2,賴朋1
摘要:本文結合作者在題庫建設中的實際工作,對本科教學中的考試題庫建設的意義、作用,以及題庫建設中需要重視的難點做出了綜述,并對題庫的深入應用、題庫的質量評價指標做出了探討。
關鍵詞:考試;題庫;區(qū)分度
基金項目:本文系2015年西華大學教育教學改革研究項目《制藥工程專業(yè)卓越人才的培養(yǎng)模式探索》的研究成果之一
作者簡介:陳晟,理學博士,講師。
在高等教育中,考試是一個必不可少的環(huán)節(jié),借此來檢驗學生對知識的掌握程度,也間接體現教師的教學工作是否達到了預計的效果。因此,如何設計考題,真實、可信地反映學生的學習成果,就是高等教育中一個極為重要的問題。
一種解決思路,就是為某一門課程設計題庫,以后每年的考試均從題庫中抽取若干題目組成考卷。本文將從題庫建設的意義、題庫建設的重點與難點、題庫的質量評價指標等方面進行一些新的探討。
一、題庫建設的意義
題庫建設的意義,已經有相當多的教師做出過論述。而本文作者在幾門本科課程的題庫建設的過程中,對題庫建設的意義有了一些新的認識。
。ㄒ唬┛疾斓姆秶右(guī)范、全面
作為一門課程的主講教師,當然有權決定把哪些知識點作為考察的重點。同時,這種權力又應該受到培養(yǎng)目標、教學大綱的制約,不能因為教師個人的好惡而隨意地改變知識點的權重。特別是對于那些復雜、抽象的知識點,往往要求教師花費更多的時間與精力才能真正將其闡釋清楚,在實踐中就存在教師“講課時一筆帶過,考察時故意回避”,將該知識點擅自忽略的可能。盡管絕大多數教師的職業(yè)道德水平,決定了這種可能性實際上非常小,但它依然是一種制度性的風險。
同時,對于同一個考點,不同的命題人可能對其重要程度的看法不同,因而影響到考察的深度和廣度,這會直接體現在題型和分值的差異上。比如,某個知識點在一張試卷上可能只是2分的選擇題,在另一位教師出題的試卷上卻可能是一道10分的論述題:盡管都考察了這個知識點,但卻影響了考試對于學生學習水平的評價的可信性和有效性,是命題者應該盡量避免的情況。
而題庫的設立,能從根本上降低上述兩種風險。題庫建設是由所有擔任該課程教學任務的教師共同參與討論,并由教研室、學院兩級依據教學大綱進行審核驗收,因而能夠保證入庫的題目質量:既能全面地覆蓋大綱要求的知識點,又能在每個知識點的考察要求上保持深淺一致。臨考前再從題庫中隨機抽取題目而產生考卷,就能把因教師認識差異而造成考點覆蓋不全面、考察深度不穩(wěn)定等現象盡可能地避免,保持該科目逐年考察要求的相對穩(wěn)定性和連貫性,更好地實現教學大綱所要求的知識掌握目標。
。ǘ┯欣谛骂}型的創(chuàng)造與應用
在一門課程的試卷中,大部分題目通常應當是常規(guī)性的題型且難度適中,目的是考察學生是否已經達到“識記”、“理解”層次的知識水平;同時,又最好能有少量(題量和分值上都較少)的非常規(guī)性的新題型,考察學生是否能夠達到靈活“應用”該知識點的層次,甚至可能在一道題目中綜合考察幾個相關的知識點。這兩類題目的重要程度不分伯仲,前者保證考察的全面性,屬于基礎;后者則可以體現考察的區(qū)分度,讓不同學生之間的掌握程度差異得以真實地體現出來,屬于“拔尖”。
然而,在以往教師單獨命題時,保證這兩類題目的均衡實際上是較為困難的。因為基礎性的常規(guī)題型數量較大、覆蓋面較廣,消耗了命題人較多的時間與精力,再想要設計出具有創(chuàng)新性、綜合性的題型,則往往力所不及。
而有了題庫之后,教師在命題時的精力得到了極大的解放:大量的、常規(guī)性的考題直接由題庫抽取產生,教師可以將精力集中在研究、創(chuàng)造新的題型上,并在例行的年度題庫維護中將其補充入題庫中。這樣,新型的考題能夠得到更好的創(chuàng)造與應用,保證了題庫的質量不斷提高。
(三)有利于防范考試作弊行為的發(fā)生
盡管在絕大多數高校中,學生考試作弊都是極其個別、偶發(fā)的現象,但從教育者的角度來說,當然是希望把這種可能降至最低。除了加強誠信教育、嚴明考試紀律外,(www.gymyzhishaji.com)我院也嘗試了通過題庫建設,從技術上杜絕作弊的可能性。
具體而言,當某一門課程的題庫建好后,臨考前抽取試卷時,教務人員會借助簡單的計算機程序,對部分考題的題號順序、部分選擇題的選項順序加以隨機打亂,從而產生2~3套不同的試卷,分發(fā)給同一個考試的學生使用。
這樣,盡管試卷上的試題本質上是完全相同的,但相鄰座位的兩名考生拿到的試卷卻可能有很大的差異,比如A1卷上的第5題變成了A2卷上的第8題,或者第3題的正確答案由“A”變成了“C”,使得抄襲他人答案、傳紙條等作弊手段就完全失去了意義。同時,試題的覆蓋面和難度都沒有發(fā)生任何實質變化,對所有考生都是公平對待的。這種同題多卷的模式,增大了作弊者的難度,確保了考察結果的真實性、可信性。
另外,因為試卷是臨考前由學院教務部門隨機抽取,連授課教師自己也并不知曉當次的具體考題,在很大程度上就避免了考試前給學生“畫重點”的不恰當做法,促使學生端正學習態(tài)度,平時認真聽課、考前全面復習,真正實現了“為學而考”而非“為考而學”的目標。
。ㄋ模┛梢宰鳛榻虒W改革的輔助評價依據
我院近年來一直大力推動本科教學質量工程建設,并參照工程類專業(yè)認證的要求進行教學改革,每年都有大量的教學改革課題立項、實施。然而,如何評價一項教學改革是否成功,依然是一個較難把握的問題。
在實施題庫建設之后,由于考題范圍、難度都相對穩(wěn)定,學生的考試成績更真實地反映了其知識水平,所以也可以作為評價一項教學改革是否成功的輔助依據。當然,考試成績并不能說明一切問題,但如果學生的平均成績沒有明顯提高,則該教學改革的效果應當是很有限的。
(五)未來的探索方向
此外,基于題庫建設,我們也在考慮可否將考試進一步改為“多題多卷”的模式,徹底地杜絕抄襲作弊的可能。
展望未來,我們還在積極探索將題庫建設和在線無紙化考試相結合的可能性,更好、更方便地評價學生的學習水平,同時也為適應未來在線教育(如MOOC課程等)預留了升級空間。
二、題庫建設中的重點與難點
在本院的題庫建設工作中,我們也總結出了一些經驗,供各位教師參考。
(一)堅持以教學大綱、教學目標作為題庫的基礎
考試從來就是手段而非目的,題庫建設也應當是服從于、服務于教學工作。因此,在題庫建設伊始,所有參與命題的教師就必須統(tǒng)一認識,嚴格按照教學大綱、教學計劃(包括各章節(jié)的學時數安排)來設計考題,力求絕大部分題目的深度都恰好達到教學大綱的要求,既不過深又不太淺,以實現教學目標為衡量標準。
。ǘ┐_保試題重復率低于一定比例
理論上說,每一屆學生考試后的試卷是要當場收回的,但在多年的教學實踐中,我們也發(fā)現一些學生能通過各種渠道獲得前幾屆的考試試卷。這就意味著,我們的題庫必須保持足夠大的題量,控制考題的重復率,否則考試就失去了意義。這樣,哪怕學生獲知了以往的考試題目,依然不能因此而推測出今年的考題,保證考試的嚴肅性和公平性。
為此,我們制定了一個經驗性的規(guī)則:每一個知識點,在題庫中至少要有兩個不同題型的題目加以考察,重要的知識點至少要有6道不同的題目存在于題庫中;同時,任何一道題目,在連續(xù)隨機抽取20次的情況下,被抽中的概率累計不能超過15%(即不能被抽中3次以上),并以此作為題庫驗收的強制性標準之一。
。ㄈ⿲︻}庫的定期維護
如上所述,為了避免歷年考題的雷同,當一道題目被抽中使用之后,至少在次年的考試中不應再將其列入。然而,如果將考過的題目一律棄之不用,又會造成題庫逐年萎縮的尷尬場面。
解決方案,就是對題庫進行定期維護,對已經使用過的部分考題“冷藏”,1~2年內不再使用,同時對該知識點進行補充;冷藏、補充的題目比例,不低于當年考題總數的30%。
同時,在每年的教研活動中,鼓勵任課教師為題庫補充新的題目,特別是新題型,以及綜合性、應用性較強的題目,并將一部分學科研究的前沿動態(tài)作為題目背景引入,不斷地保持和提高題庫的質量與時效性。
。ㄋ模╊}庫的驗收制度
為確保題庫建設質量,在題庫建設中,采取了教研室、學院兩級驗收的制度。教研室主要是結合教學大綱,確認知識點得到了全面的覆蓋且考察的難度適中;學院層面則由教務部門牽頭,通過隨機多次抽取核對試題重復率、抽查知識點在題庫中被考察的題目數等技術指標來保證題庫的容量。
另外,為全面評價題庫的質量與難易程度,每一門課程的題庫驗收時,均需組織一次模擬測試,參加測試的人員為1~2名擔任本課程教學的教師,加上1~2名經過短暫復習的研究生同學(本次題庫建設僅涉及為本科生開設的課程),以此來評估試題的難度和數量是否適合絕大多數應考學生的水平。
三、對試題庫質量的評估體系
在一道試題沒有被實際使用之前,對它所做出的評價多少帶有主觀色彩。同時,囿于教師與學生的知識水平差異,這種評價有時候甚至會出現相當大的偏差。
為此,參考國內外的研究成果,結合課程實際,我們制定了一些試題評估的指標,在每一年考試結束之后,由教研室組織對當年的試卷進行評估,回顧式地評價試題質量,并作為試題庫維護和調整的重要依據。
。ㄒ唬┲匾曉囶}的區(qū)分度指標
試題的區(qū)分度D,是目前較為公認的試題定量評價四個指標之一,它體現了一道試題在辨別、區(qū)分學生知識水平上所產生的貢獻。不同的文獻中,提出了多種區(qū)分度的計算方法,本院采取的計算方法是:先按照全卷總分,對全體考生由高到低進行排序,取排在前27%的考生稱為高分考生,排在最后27%的考生稱為低分考生。然后,對每一道題目,分別統(tǒng)計高分考生的平均分(PH)和低分考生所獲得的平均分(PL)。則:D=PH/PL
因此,D值越大,則說明此題目區(qū)分高分考生和低分考生的效果就越明顯;而此指標過高或過低,都不利于考察全體學生的學習水平。經過調研和討論,我們認為,每道題目的D值的合理區(qū)間定在2~5比較恰當,個別考題允許D值達到7,以此來拉開考分差距,但全卷的平均D值應當控制在2~3之間。
。ǘ┐_保試題的難度系數指標
試題的難度系數P,也是通行的四個評價指標之一,其計算方式為:
統(tǒng)計所有考生在某一個題目上的得分,計為x,而該題設定的滿分為w,則:P=1-x/y.
參考國內外的研究文獻,結合以往考試的實際情況,我們認為,將P值的區(qū)間定在0.4~0.6之間較為合理,允許個別題目的P值處于0.3~0.8的區(qū)間,全卷的平均P值最好處于0.3~0.5之間。
在回顧性的分析中,如果某一道題目實測的D值或P值,嚴重偏離了我們預計的范圍,則需要對該題目進行討論,決定是否加以修改、替換。
。ㄈ┰和、校外專家的評分制度
因為試卷對于考生都是一次性使用,不可能重測,所以很難通過回顧性的統(tǒng)計數據來評價考題的信度(Reliability)和效度(Validity)指標。為此,我們邀請了院外、校外教授相同學科的資深教師,抽取題庫中的部分題目進行了評估。具體方式為:
對一道題目,按照題目與它所考察的知識點之間的關系進行打分,最高5分(緊密吻合),最低1分(基本無關),取幾位專家的打分平均值,以此來評價其效度。經過實際評分,送評的題目基本上都達到了4分以上,證明我們建設的題庫質量還是較高的。
而對于信度指標,我們采取的是將一道題目的P值,與近5年來考察該知識點的題目的平均P值進行比較的方式,但考慮到各屆學生實際情況不同,加上近年來教學質量工程的推進,這種評估方式未必合理,還有待于進一步的研究。
四、結語
綜上所述,我們認為,為本科課程建設配套的考試題庫,有利于全面、客觀、有效地評價學生的學習成果,有利于教學改革的推進與評價;更有助于端正學風、考風,促使教師更用心地授課,學生更認真地聽課、復習,真正達到全面推動教學質量提高的目的,而這也正是高校教學改革的最終目標所在,具有較強的積極作用。
參考文獻:
[1]劉靜。關于高校試題題庫建設的若干思考[J].中國社會醫(yī)學雜志,2009,(3):143.
[2]李光明。如何做好題庫建設———來自英美考試機構的啟示[J].中國考試,2011,(12):3.
[3]李光明。關于題庫建設若干問題的思考[J].中國考試,2014,(9):3.
[4]傅強。淺析中藥藥理學教考分離和試題庫建設[J].海峽藥學,2014,(9):150.
[5]李永華。網絡化考試的題庫建設及應用研究[J].高教論壇,2013,(10):57.
[6]鄭群。醫(yī)學微生物學題庫建設的實踐與探索[J].繼續(xù)醫(yī)學教育,2013,(10):78.
【論本科教學中題庫建設的意義及質量評價體系】相關文章:
建設高質量教育體系心得11-21
教學質量保障體系和調控系統(tǒng)建設的研究實踐08-15
論新建公安本科院校實踐教學質量監(jiān)控與評價體系的構建08-17
建設高質量教育體系心得15篇11-21
建設高質量教育體系心得體會03-30
建設高質量的教育體系心得體會11-22
構建合理的高中作文教學評價體系08-20
農產品質量安全體系建設調研報告08-24
社會信用體系建設報告08-24
跳繩的意義及在體育教學中的運用08-23