成就測驗(yàn)
目錄
1.什么是成就測驗(yàn)
成就測驗(yàn)就是我們通常所說的考試。成就測驗(yàn)主要是針對特定領(lǐng)域?yàn)闄z測應(yīng)試者對有關(guān)知識和技能的掌握程度而設(shè)計(jì)的??荚噾?yīng)用的領(lǐng)域非常廣泛,自我國科舉首創(chuàng)考試以來,一直沿用至今,并且現(xiàn)在考試已逐步向標(biāo)準(zhǔn)化、客觀化發(fā)展;但考試更偏重于知識和技能的考察,所以它考察人的素質(zhì)的全面性程度常常受到質(zhì)疑。
2.成就測驗(yàn)的歷史發(fā)展
(1) 最遲在漢朝,中國便已經(jīng)有了非正式的考試制度。公元1370年(明朝初期)筆試成為科舉取士的一部分,這可視為成就測驗(yàn)的正式開始。
(2) 今天在世界各地廣泛應(yīng)用的標(biāo)準(zhǔn)化成就測驗(yàn)發(fā)源于美國,始創(chuàng)者是賴斯。另外一個(gè)早期的奠基人是愛德華·李·桑代克。并且桑代克被公認(rèn)為是教育測驗(yàn)的鼻祖。
3.成就測驗(yàn)與其它測驗(yàn)的區(qū)別
成就測驗(yàn)和智力測驗(yàn)、能力傾向測驗(yàn)的區(qū)別:成就測驗(yàn)和智力測驗(yàn)、能力傾向測驗(yàn)的測量對象都是認(rèn)知性特質(zhì)。這三種測驗(yàn)都是測量個(gè)體從與環(huán)境的相互作用經(jīng)驗(yàn)中發(fā)展出來的能力。所以在本質(zhì)上,它們有相同之處。能力傾向、智力測驗(yàn)所測量的也可以看作一種“成就”。不過,如果從測驗(yàn)的目的、性質(zhì)及所含蓋的經(jīng)驗(yàn)范圍來看,這三種測驗(yàn)仍有某些不同之處,不能相互取代。
就測驗(yàn)的對象而言,三者本質(zhì)上有重疊之處,無法加以截然區(qū)分。大多學(xué)者認(rèn)為成就測驗(yàn)測量的是一些特定的、限定于某一范圍的能力和知識,而另兩者所測驗(yàn)的則為一般性的、較為廣泛的能力。
從功能上看,成就測驗(yàn)也不同于智力、能力傾向測驗(yàn)。后兩者的主要功能是預(yù)測一個(gè)人在未來的教育、訓(xùn)練或工作經(jīng)驗(yàn)中可能的表現(xiàn),它們的使用是在教育或訓(xùn)練程序以前,用以反映被試是否有接受某種課程或?qū)I(yè)技能訓(xùn)練的能力。成就測驗(yàn)則是評估被試在接受一些教育或訓(xùn)練程序后所獲得的學(xué)習(xí)成果,它的實(shí)施發(fā)生在教育、訓(xùn)練過程后。在測驗(yàn)的技術(shù)品質(zhì)上,成就測驗(yàn)要注重內(nèi)容效度,而能力傾向、智力測驗(yàn)則必須有較高的預(yù)測效度,否則就失去其基本價(jià)值。
4.成就測驗(yàn)的功能
成就測驗(yàn)主要用于教育領(lǐng)域。概括地說,成就測驗(yàn)在教育上的用途分為四種,即反饋、評價(jià)、科研和選拔安置。
(一)反饋功能
成就測驗(yàn)的得分可以作為反饋信息,調(diào)節(jié)教師的教學(xué)活動。在某一教學(xué)階段開始前的成就測驗(yàn),能使教師了解學(xué)生對完成本階段學(xué)習(xí)任務(wù)的智力、知識和技能的準(zhǔn)備情況,為修改教育目標(biāo)和教學(xué)計(jì)劃提供依據(jù)。在教學(xué)過程中的檢查測驗(yàn),能使教師了解學(xué)生對有關(guān)知識、技能的掌握情況,診斷出學(xué)生的學(xué)習(xí)困難之所在,以便及時(shí)發(fā)現(xiàn)教和學(xué)中的問題,從而調(diào)整教學(xué)內(nèi)容,改進(jìn)教學(xué)方法。在某一教學(xué)階段終了后的總結(jié)測驗(yàn),能使教師了解教育目標(biāo)是否達(dá)到,了解學(xué)生綜合應(yīng)用和遷移知識、技能的能力,同時(shí)為制定新的教育目標(biāo)提供依據(jù)。圖8-2表明了在教學(xué)的各個(gè)環(huán)節(jié)中測驗(yàn)的反饋功能。
測驗(yàn)的反饋信息還可促進(jìn)學(xué)生的學(xué)習(xí)活動。考試結(jié)果能使學(xué)生明了自己的學(xué)習(xí)情況,作出自我評價(jià),找出薄弱環(huán)節(jié),調(diào)整自己的學(xué)習(xí)方法,并確定新的努力目標(biāo);考試的氣氛及對分?jǐn)?shù)的正負(fù)強(qiáng)化,在一定程度上具有動機(jī)激發(fā)作用,能引起或滿足學(xué)生渴望成功、得到社會承認(rèn)的需要,從而提高學(xué)習(xí)活動的積極性。
(二)評價(jià)功能
成就測驗(yàn)不但可用于評價(jià)學(xué)生,還可用于評價(jià)教師,評價(jià)一所學(xué)校或一個(gè)地區(qū)的教學(xué)質(zhì)量;不但可作跨區(qū)域的橫向比較,還可作跨年代的縱向比較。但我們要注意,在評價(jià)時(shí)一定要參照許多其他信息,不能單看測驗(yàn)分?jǐn)?shù)。
(三)研究工具
測驗(yàn)對教育理論的研究和發(fā)展具有重要作用。好的教育體制、教材和教法,要通過教育效果來體現(xiàn),而教育效果在一定程度上又要通過測驗(yàn)成績來檢查。很多教改實(shí)踐的效果都要通過一定的成就測驗(yàn)來檢驗(yàn)。
(四)人才選拔與安置
學(xué)績測驗(yàn)經(jīng)常用來作為選人的工具,例如各種升學(xué)考試、招工考試等;也可用來確定一個(gè)人是否達(dá)到了從事某項(xiàng)活動所需要的最低熟練水平;還可對人員進(jìn)行分類,把每個(gè)人安置到適當(dāng)?shù)奈恢蒙先ァ?
5.成就測驗(yàn)的分類
成就測驗(yàn)根據(jù)不同分類方式可以分成不同的種類。
- (一)按反應(yīng)方式分
成就測驗(yàn)從反應(yīng)方式上,可分為實(shí)作測驗(yàn)和紙筆測驗(yàn)。這與我們前面介紹的概念是一致的。實(shí)作測驗(yàn)需要具體操作,如表演體操、調(diào)整機(jī)器等。紙筆測驗(yàn)又可分為再認(rèn)式和回憶式兩類。再認(rèn)式題目是把若干學(xué)習(xí)過的內(nèi)容,重新呈現(xiàn)在被試面前,讓被試辨認(rèn)或排列組合,如是非題、多選題、匹配題、順序題等?;貞浭筋}目是所學(xué)過的內(nèi)容不在眼前,要被試回憶,寫出一個(gè)答案來,如填空題、簡答題、論文題等。
- (二)按編制方法分
從編制方法上可分為標(biāo)準(zhǔn)化成就測驗(yàn)和教師自編測驗(yàn)。標(biāo)準(zhǔn)化成就測驗(yàn)是由專門機(jī)構(gòu)編制的,測驗(yàn)內(nèi)容和常模樣本較為普遍,而教師自編測驗(yàn)通常因教師、課程、班級或教學(xué)單元的不同而有所更換,其內(nèi)容范圍和常模樣本較為狹窄。
- (三)從用途上分
從總的用途上看可分為形成性測驗(yàn)和總結(jié)性測驗(yàn)。成就測驗(yàn)的傳統(tǒng)用途是在學(xué)習(xí)單元或全部課程結(jié)束后實(shí)施測驗(yàn),以測量學(xué)生是否已達(dá)到教學(xué)目標(biāo)。從技術(shù)上講,這種用途稱為總結(jié)性評估,它以測驗(yàn)成績作為最終產(chǎn)物,目的是對學(xué)生的學(xué)習(xí)作一終結(jié)性的評價(jià),如好壞、過關(guān)還是不過關(guān)。另一類是形成性評估,這種評估是把教育過程和評估結(jié)合起來,在教學(xué)進(jìn)行過程中測量學(xué)生的進(jìn)步情況。形成性測驗(yàn)是教學(xué)活動中的一個(gè)有機(jī)部分,通過對學(xué)習(xí)者在學(xué)習(xí)過程中的表現(xiàn)進(jìn)行評估,可以指導(dǎo)學(xué)生決定是復(fù)習(xí)還是繼續(xù)學(xué)習(xí)下一個(gè)單元。
- (四)按解釋分?jǐn)?shù)的方法分
根據(jù)解釋分?jǐn)?shù)的方法的不同,可分為標(biāo)準(zhǔn)參照測驗(yàn)和常模參照測驗(yàn)。這兩種測驗(yàn)前面已經(jīng)討論過。在實(shí)際應(yīng)用中,許多成就測驗(yàn)既可以是常模參照測驗(yàn),也可以是標(biāo)準(zhǔn)參照測驗(yàn),了解一個(gè)人已經(jīng)學(xué)了多少(標(biāo)準(zhǔn)參照測驗(yàn)的功能)和把一個(gè)人的成績與其他人作比較(常模參照測驗(yàn)的功能),有時(shí)可以由同一個(gè)測驗(yàn)來完成。
- (五)從測驗(yàn)的功能上分
從測驗(yàn)的功能上可分為檢查測驗(yàn)、水平測驗(yàn)、預(yù)測性測驗(yàn)、診斷性測驗(yàn)和準(zhǔn)備性測驗(yàn)。
1)檢查測驗(yàn)主要用來考察被試對某種知識、技能總的掌握情況,而不是被試所具有的長處和不足。
2)水平測驗(yàn)是一種標(biāo)準(zhǔn)參照測驗(yàn),是用來考察學(xué)生是否達(dá)到某種要求的能力水平的一種測試。它不是用來確定被試在人群中的位置,而是用來對被試達(dá)標(biāo)情況進(jìn)行判斷。這種測驗(yàn)又可稱為基本技能最低限度測驗(yàn)。
3)預(yù)測性測驗(yàn)通常用來預(yù)測被試未來的學(xué)習(xí)成就。一般它所包含的題目比相同學(xué)科的一般成就測驗(yàn)復(fù)雜,在預(yù)測今后是否成功方面,其作用與性向測驗(yàn)相類似。預(yù)測性測驗(yàn)有閱讀測驗(yàn)、算術(shù)測驗(yàn)和外語測驗(yàn)等等。
4)診斷性測驗(yàn)?zāi)荑b別被試在學(xué)習(xí)功課方面的困難。編制這種測驗(yàn)必須把被試在各個(gè)學(xué)科上的成績分解成在各種技能上的成績,再分別設(shè)計(jì)出測量這些技能的題目。一般成就測驗(yàn)只可用于比較被試在人群中的相對位置,卻不知道對具體技能的掌握情況,而診斷性測驗(yàn)可以了解被試在幾個(gè)基本技能上的優(yōu)劣,從而提供改進(jìn)的依據(jù)。診斷性測驗(yàn)包括的題目差別很大,施測時(shí)間比相同學(xué)科檢查測驗(yàn)長,有時(shí)還要用到特殊儀器,如眼動儀等。在使用時(shí),一般成就測驗(yàn)通常是第一步,它給出被試在各個(gè)課程中表現(xiàn)的具體情況,如需要評估被試在特定領(lǐng)域的成就,可以實(shí)施單科檢查測驗(yàn),最后如果需要仔細(xì)分析個(gè)體在閱讀、算術(shù)等方面的困難及其原因時(shí),可以實(shí)施診斷性測驗(yàn)。
5)準(zhǔn)備性測驗(yàn)主要考查學(xué)生在一個(gè)特定的教育任務(wù)上是否做好了準(zhǔn)備,其效度由對有關(guān)領(lǐng)域的教學(xué)做好準(zhǔn)備的學(xué)生同沒有做好準(zhǔn)備的學(xué)生之間的有效區(qū)分決定。
- (六)從測驗(yàn)的內(nèi)容范圍分
從測驗(yàn)的內(nèi)容范圍上,可分為成套成就測驗(yàn)和單科測驗(yàn)。成套成就測驗(yàn)是包括不同內(nèi)容范圍的一套測驗(yàn),每個(gè)分測驗(yàn)包括某種學(xué)科的知識,各分測驗(yàn)得分可互相比較。當(dāng)然分測驗(yàn)也可以單獨(dú)使用,但這樣做比單科測驗(yàn)的信度和效度低。單科測驗(yàn)包括特殊領(lǐng)域的知識,適合于確定被試在該領(lǐng)域的成就大小。
6.成就測驗(yàn)的選用
各種不同的成就測驗(yàn),其分類可以是重疊的。例如,單科檢查測驗(yàn)既可以是總結(jié)性評估式的也可以是形成性評估式的,既可以是標(biāo)準(zhǔn)參照的也可以是常模參照的。我們必須根據(jù)自己的目的,合理選用不同的成就測驗(yàn)。
選擇標(biāo)準(zhǔn)化成就測驗(yàn)與編制隨堂測驗(yàn)的基本原理一樣,主要是選擇與具體組織、班級、學(xué)?;蚪逃到y(tǒng)的教育目標(biāo)相匹配的內(nèi)容及難度適宜的測驗(yàn)。在決定所用測驗(yàn)之前,必須先確定被試的知識或能力水平、教學(xué)內(nèi)容和目標(biāo)、分?jǐn)?shù)的應(yīng)用方式等,具體來說就是先確定使用測驗(yàn)的目的和實(shí)際條件,如你是用來對學(xué)生進(jìn)行評估、安置、診斷學(xué)習(xí)困難、安排學(xué)習(xí)計(jì)劃,還是用來評估教學(xué)進(jìn)展情況。在使用測驗(yàn)前應(yīng)該認(rèn)真閱讀測驗(yàn)手冊,看測驗(yàn)的目的是否符合自己的要求,施測條件是否能滿足等。
確定目的和實(shí)際條件后還需要了解測驗(yàn)的信度、效度和常模等情況,這些內(nèi)容在前面基本理論部分已經(jīng)介紹過,這里只討論成就測驗(yàn)特殊的地方。對于成就測驗(yàn)來說,一般信度系數(shù)應(yīng)在0.80~0.90之間,復(fù)本信度應(yīng)比內(nèi)部一致性信度高。內(nèi)容效度一般最為重要,但如果是預(yù)測性測驗(yàn),還需要提供預(yù)測效度的證據(jù)。常模資料也應(yīng)滿足測驗(yàn)的目的。