成就測驗
1.什么是成就測驗
成就測驗就是我們通常所說的考試。成就測驗主要是針對特定領(lǐng)域為檢測應(yīng)試者對有關(guān)知識和技能的掌握程度而設(shè)計的??荚噾?yīng)用的領(lǐng)域非常廣泛,自我國科舉首創(chuàng)考試以來,一直沿用至今,并且現(xiàn)在考試已逐步向標準化、客觀化發(fā)展;但考試更偏重于知識和技能的考察,所以它考察人的素質(zhì)的全面性程度常常受到質(zhì)疑。
2.成就測驗的歷史發(fā)展
(1) 最遲在漢朝,中國便已經(jīng)有了非正式的考試制度。公元1370年(明朝初期)筆試成為科舉取士的一部分,這可視為成就測驗的正式開始。
(2) 今天在世界各地廣泛應(yīng)用的標準化成就測驗發(fā)源于美國,始創(chuàng)者是賴斯。另外一個早期的奠基人是愛德華·李·桑代克。并且桑代克被公認為是教育測驗的鼻祖。
3.成就測驗與其它測驗的區(qū)別
成就測驗和智力測驗、能力傾向測驗的區(qū)別:成就測驗和智力測驗、能力傾向測驗的測量對象都是認知性特質(zhì)。這三種測驗都是測量個體從與環(huán)境的相互作用經(jīng)驗中發(fā)展出來的能力。所以在本質(zhì)上,它們有相同之處。能力傾向、智力測驗所測量的也可以看作一種“成就”。不過,如果從測驗的目的、性質(zhì)及所含蓋的經(jīng)驗范圍來看,這三種測驗仍有某些不同之處,不能相互取代。
就測驗的對象而言,三者本質(zhì)上有重疊之處,無法加以截然區(qū)分。大多學者認為成就測驗測量的是一些特定的、限定于某一范圍的能力和知識,而另兩者所測驗的則為一般性的、較為廣泛的能力。
從功能上看,成就測驗也不同于智力、能力傾向測驗。后兩者的主要功能是預(yù)測一個人在未來的教育、訓(xùn)練或工作經(jīng)驗中可能的表現(xiàn),它們的使用是在教育或訓(xùn)練程序以前,用以反映被試是否有接受某種課程或?qū)I(yè)技能訓(xùn)練的能力。成就測驗則是評估被試在接受一些教育或訓(xùn)練程序后所獲得的學習成果,它的實施發(fā)生在教育、訓(xùn)練過程后。在測驗的技術(shù)品質(zhì)上,成就測驗要注重內(nèi)容效度,而能力傾向、智力測驗則必須有較高的預(yù)測效度,否則就失去其基本價值。
4.成就測驗的功能
成就測驗主要用于教育領(lǐng)域。概括地說,成就測驗在教育上的用途分為四種,即反饋、評價、科研和選拔安置。
(一)反饋功能
成就測驗的得分可以作為反饋信息,調(diào)節(jié)教師的教學活動。在某一教學階段開始前的成就測驗,能使教師了解學生對完成本階段學習任務(wù)的智力、知識和技能的準備情況,為修改教育目標和教學計劃提供依據(jù)。在教學過程中的檢查測驗,能使教師了解學生對有關(guān)知識、技能的掌握情況,診斷出學生的學習困難之所在,以便及時發(fā)現(xiàn)教和學中的問題,從而調(diào)整教學內(nèi)容,改進教學方法。在某一教學階段終了后的總結(jié)測驗,能使教師了解教育目標是否達到,了解學生綜合應(yīng)用和遷移知識、技能的能力,同時為制定新的教育目標提供依據(jù)。圖8-2表明了在教學的各個環(huán)節(jié)中測驗的反饋功能。
測驗的反饋信息還可促進學生的學習活動??荚嚱Y(jié)果能使學生明了自己的學習情況,作出自我評價,找出薄弱環(huán)節(jié),調(diào)整自己的學習方法,并確定新的努力目標;考試的氣氛及對分數(shù)的正負強化,在一定程度上具有動機激發(fā)作用,能引起或滿足學生渴望成功、得到社會承認的需要,從而提高學習活動的積極性。
(二)評價功能
成就測驗不但可用于評價學生,還可用于評價教師,評價一所學?;蛞粋€地區(qū)的教學質(zhì)量;不但可作跨區(qū)域的橫向比較,還可作跨年代的縱向比較。但我們要注意,在評價時一定要參照許多其他信息,不能單看測驗分數(shù)。
(三)研究工具
測驗對教育理論的研究和發(fā)展具有重要作用。好的教育體制、教材和教法,要通過教育效果來體現(xiàn),而教育效果在一定程度上又要通過測驗成績來檢查。很多教改實踐的效果都要通過一定的成就測驗來檢驗。
(四)人才選拔與安置
學績測驗經(jīng)常用來作為選人的工具,例如各種升學考試、招工考試等;也可用來確定一個人是否達到了從事某項活動所需要的最低熟練水平;還可對人員進行分類,把每個人安置到適當?shù)奈恢蒙先ァ?
5.成就測驗的分類
成就測驗根據(jù)不同分類方式可以分成不同的種類。
- (一)按反應(yīng)方式分
成就測驗從反應(yīng)方式上,可分為實作測驗和紙筆測驗。這與我們前面介紹的概念是一致的。實作測驗需要具體操作,如表演體操、調(diào)整機器等。紙筆測驗又可分為再認式和回憶式兩類。再認式題目是把若干學習過的內(nèi)容,重新呈現(xiàn)在被試面前,讓被試辨認或排列組合,如是非題、多選題、匹配題、順序題等?;貞浭筋}目是所學過的內(nèi)容不在眼前,要被試回憶,寫出一個答案來,如填空題、簡答題、論文題等。
- (二)按編制方法分
從編制方法上可分為標準化成就測驗和教師自編測驗。標準化成就測驗是由專門機構(gòu)編制的,測驗內(nèi)容和常模樣本較為普遍,而教師自編測驗通常因教師、課程、班級或教學單元的不同而有所更換,其內(nèi)容范圍和常模樣本較為狹窄。
- (三)從用途上分
從總的用途上看可分為形成性測驗和總結(jié)性測驗。成就測驗的傳統(tǒng)用途是在學習單元或全部課程結(jié)束后實施測驗,以測量學生是否已達到教學目標。從技術(shù)上講,這種用途稱為總結(jié)性評估,它以測驗成績作為最終產(chǎn)物,目的是對學生的學習作一終結(jié)性的評價,如好壞、過關(guān)還是不過關(guān)。另一類是形成性評估,這種評估是把教育過程和評估結(jié)合起來,在教學進行過程中測量學生的進步情況。形成性測驗是教學活動中的一個有機部分,通過對學習者在學習過程中的表現(xiàn)進行評估,可以指導(dǎo)學生決定是復(fù)習還是繼續(xù)學習下一個單元。
- (四)按解釋分數(shù)的方法分
根據(jù)解釋分數(shù)的方法的不同,可分為標準參照測驗和常模參照測驗。這兩種測驗前面已經(jīng)討論過。在實際應(yīng)用中,許多成就測驗既可以是常模參照測驗,也可以是標準參照測驗,了解一個人已經(jīng)學了多少(標準參照測驗的功能)和把一個人的成績與其他人作比較(常模參照測驗的功能),有時可以由同一個測驗來完成。
- (五)從測驗的功能上分
從測驗的功能上可分為檢查測驗、水平測驗、預(yù)測性測驗、診斷性測驗和準備性測驗。
1)檢查測驗主要用來考察被試對某種知識、技能總的掌握情況,而不是被試所具有的長處和不足。
2)水平測驗是一種標準參照測驗,是用來考察學生是否達到某種要求的能力水平的一種測試。它不是用來確定被試在人群中的位置,而是用來對被試達標情況進行判斷。這種測驗又可稱為基本技能最低限度測驗。
3)預(yù)測性測驗通常用來預(yù)測被試未來的學習成就。一般它所包含的題目比相同學科的一般成就測驗復(fù)雜,在預(yù)測今后是否成功方面,其作用與性向測驗相類似。預(yù)測性測驗有閱讀測驗、算術(shù)測驗和外語測驗等等。
4)診斷性測驗?zāi)荑b別被試在學習功課方面的困難。編制這種測驗必須把被試在各個學科上的成績分解成在各種技能上的成績,再分別設(shè)計出測量這些技能的題目。一般成就測驗只可用于比較被試在人群中的相對位置,卻不知道對具體技能的掌握情況,而診斷性測驗可以了解被試在幾個基本技能上的優(yōu)劣,從而提供改進的依據(jù)。診斷性測驗包括的題目差別很大,施測時間比相同學科檢查測驗長,有時還要用到特殊儀器,如眼動儀等。在使用時,一般成就測驗通常是第一步,它給出被試在各個課程中表現(xiàn)的具體情況,如需要評估被試在特定領(lǐng)域的成就,可以實施單科檢查測驗,最后如果需要仔細分析個體在閱讀、算術(shù)等方面的困難及其原因時,可以實施診斷性測驗。
5)準備性測驗主要考查學生在一個特定的教育任務(wù)上是否做好了準備,其效度由對有關(guān)領(lǐng)域的教學做好準備的學生同沒有做好準備的學生之間的有效區(qū)分決定。
- (六)從測驗的內(nèi)容范圍分
從測驗的內(nèi)容范圍上,可分為成套成就測驗和單科測驗。成套成就測驗是包括不同內(nèi)容范圍的一套測驗,每個分測驗包括某種學科的知識,各分測驗得分可互相比較。當然分測驗也可以單獨使用,但這樣做比單科測驗的信度和效度低。單科測驗包括特殊領(lǐng)域的知識,適合于確定被試在該領(lǐng)域的成就大小。
6.成就測驗的選用
各種不同的成就測驗,其分類可以是重疊的。例如,單科檢查測驗既可以是總結(jié)性評估式的也可以是形成性評估式的,既可以是標準參照的也可以是常模參照的。我們必須根據(jù)自己的目的,合理選用不同的成就測驗。
選擇標準化成就測驗與編制隨堂測驗的基本原理一樣,主要是選擇與具體組織、班級、學?;蚪逃到y(tǒng)的教育目標相匹配的內(nèi)容及難度適宜的測驗。在決定所用測驗之前,必須先確定被試的知識或能力水平、教學內(nèi)容和目標、分數(shù)的應(yīng)用方式等,具體來說就是先確定使用測驗的目的和實際條件,如你是用來對學生進行評估、安置、診斷學習困難、安排學習計劃,還是用來評估教學進展情況。在使用測驗前應(yīng)該認真閱讀測驗手冊,看測驗的目的是否符合自己的要求,施測條件是否能滿足等。
確定目的和實際條件后還需要了解測驗的信度、效度和常模等情況,這些內(nèi)容在前面基本理論部分已經(jīng)介紹過,這里只討論成就測驗特殊的地方。對于成就測驗來說,一般信度系數(shù)應(yīng)在0.80~0.90之間,復(fù)本信度應(yīng)比內(nèi)部一致性信度高。內(nèi)容效度一般最為重要,但如果是預(yù)測性測驗,還需要提供預(yù)測效度的證據(jù)。常模資料也應(yīng)滿足測驗的目的。