登錄

效度

1.什么是效度

效度表示一項(xiàng)研究的真實(shí)性和準(zhǔn)確性程度。又稱真確性。它與研究的目標(biāo)密切相關(guān),一項(xiàng)研究所得結(jié)果必須符合其目標(biāo)才是有效的,因而效度也就是達(dá)到目標(biāo)的程度。效度是相對(duì)的,僅針對(duì)特定目標(biāo)而言,因此只有程度上的差別。

在測(cè)量方面,效度指一種測(cè)量手段能夠測(cè)得預(yù)期結(jié)果的程度。從統(tǒng)計(jì)學(xué)角度可把效度(rXY)定義為潛在真分?jǐn)?shù)方差(垏)與實(shí)得分?jǐn)?shù)方差(垑)的比率,即:Image:rxy.gif。效度與信度的關(guān)系為:信 度是效度的必要條件,但不是充分條件。一個(gè)測(cè)量的效度要高,其信度必須高,而一個(gè)測(cè)量的信度高時(shí),效度并不一定高。

2.測(cè)量效度的方法

考驗(yàn)效度的方法很多,J.W.弗倫奇和W.B.米歇貝根據(jù)測(cè)驗(yàn)?zāi)繕?biāo)把效度分為內(nèi)容效度、構(gòu)想效度和效標(biāo)關(guān)聯(lián)效度,這種分類為美國心理學(xué)會(huì)在1974年發(fā)行的《教育與心理測(cè)驗(yàn)的標(biāo)準(zhǔn)》一書所采納,成為通行的效度分類方法。

(1)內(nèi)容效度指測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為范圍取樣的適當(dāng)性。成就測(cè)驗(yàn)和熟練測(cè)驗(yàn)特別注重這種效度。例如,在成就測(cè)驗(yàn)中,測(cè)驗(yàn)題目是根據(jù)教學(xué)大綱和教材內(nèi)容適當(dāng)抽出的,內(nèi)容效度就是判斷測(cè)驗(yàn)題目(內(nèi)容)是否符合它欲測(cè)的目標(biāo)。由于這種衡量效度的方法必須針對(duì)課程的目標(biāo)和內(nèi)容,以系統(tǒng)的邏輯方法詳細(xì)分析題目的性能,故又稱課程效度或邏輯效度。確定內(nèi)容效度的方法主要有兩種:①專家判斷,即由有關(guān)專家對(duì)測(cè)驗(yàn)題目與原定內(nèi)容范圍的符合性作出判斷;②統(tǒng)計(jì)分析,即以一組被試在取自同樣內(nèi)容范圍的兩個(gè)獨(dú)立測(cè)驗(yàn)上得分的相關(guān)作出估計(jì)。內(nèi)容效度很容易與表面效度相混淆,實(shí)際上兩者意義不同。表面效度指從外表(如測(cè)驗(yàn)的材料及用語、試題的印刷等)直觀地看,測(cè)驗(yàn)題目與測(cè)量目標(biāo)的一致程度,它與內(nèi)容效度所指測(cè)驗(yàn)在實(shí)際測(cè)量上的有效程度不同。從技術(shù)意義上嚴(yán)格地說,表面效度不是效度,但為了取得被試的信任與合作,表面效度也不可忽視。

(2)構(gòu)想效度指測(cè)驗(yàn)分?jǐn)?shù)能夠說明心理學(xué)理論上的某種結(jié)構(gòu)或特質(zhì)的程度。它主要適用于心理測(cè)驗(yàn),其目的是以心理學(xué)的概念說明和分析測(cè)驗(yàn)分?jǐn)?shù)的意義,即從心理學(xué)的理論觀點(diǎn)對(duì)測(cè)驗(yàn)的結(jié)果加以解釋和探討。在心理學(xué)上,所謂構(gòu)想是指心理學(xué)理論所涉及的抽象而屬假設(shè)性的概念、特質(zhì)或變量,如智力、焦慮、機(jī)械能力傾向、成就動(dòng)機(jī)等,通常采用某種操作性定義并用測(cè)驗(yàn)來測(cè)量。確定構(gòu)想效度的邏輯和方法一般是:先從某一構(gòu)想的理論出發(fā),導(dǎo)出各項(xiàng)關(guān)于心理功能或行為的基本假設(shè),據(jù)以設(shè)計(jì)和編制測(cè)驗(yàn),然后由果求因,以相關(guān)、實(shí)驗(yàn)和因素分析等方法,審查測(cè)驗(yàn)結(jié)果是否符合心理學(xué)上的理論觀點(diǎn)。

(3)效標(biāo)關(guān)聯(lián)效度指測(cè)驗(yàn)分?jǐn)?shù)與效度標(biāo)準(zhǔn)的一致程度。效度標(biāo)準(zhǔn)簡(jiǎn)稱效標(biāo),是足以反映測(cè)驗(yàn)所欲測(cè)量或預(yù)測(cè)的特質(zhì)的獨(dú)立量數(shù),并作為估計(jì)效度的參照標(biāo)準(zhǔn)。測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)的一致程度以二者的相關(guān)系數(shù)表示,這種相關(guān)系數(shù)稱為效度系數(shù)。效度系數(shù)越大,測(cè)驗(yàn)的效度越高。由于用相關(guān)系數(shù)這種統(tǒng)計(jì)數(shù)值表示,這種效度又稱統(tǒng)計(jì)效度。效標(biāo)關(guān)聯(lián)效度可分同時(shí)效度和預(yù)測(cè)效度。同時(shí)效度指測(cè)驗(yàn)分?jǐn)?shù)與當(dāng)前的效標(biāo)之間的相關(guān)程度,通常與心理特性的評(píng)估和診斷有關(guān),常用的效標(biāo)資料包括在校學(xué)業(yè)成績(jī)、教師評(píng)定的等級(jí)、臨床檢查、其他同性質(zhì)測(cè)驗(yàn)的結(jié)果等;預(yù)測(cè)效度指測(cè)驗(yàn)分?jǐn)?shù)與將來的效標(biāo)之間的相關(guān)程度,它對(duì)人員的甄選、分類與安置工作等甚為重要,常用的效標(biāo)資料包括專業(yè)訓(xùn)練的成績(jī)和實(shí)際工作的成果等。它運(yùn)用追蹤法對(duì)行為表現(xiàn)作長(zhǎng)期觀察、考核和記錄,以累積所得的事實(shí)資料衡量測(cè)驗(yàn)結(jié)果對(duì)將來成就的預(yù)測(cè)性。

測(cè)量的各種效度的區(qū)別在于各自強(qiáng)調(diào)的方面不同。一個(gè)測(cè)驗(yàn)可以有多種效度,每種效度視使用者的具體目的而定,因此,一般不存在測(cè)驗(yàn)的統(tǒng)一效度。但各種效度又是相互聯(lián)系和補(bǔ)充的。內(nèi)容效度和構(gòu)想效度既是效標(biāo)關(guān)聯(lián)效度的保證,又須得到它的支持??疾靸?nèi)容效度和效標(biāo)關(guān)聯(lián)效度又有助于確定構(gòu)想效度。

3.內(nèi)在效度與外在效度

評(píng)論  |   0條評(píng)論