相關(guān)分析
1.什么是相關(guān)分析
相關(guān)分析就是對(duì)總體中確實(shí)具有聯(lián)系的標(biāo)志進(jìn)行分析,其主體是對(duì)總體中具有因果關(guān)系標(biāo)志的分析。它是描述客觀事物相互間關(guān)系的密切程度并用適當(dāng)?shù)?a href="/wiki/%E7%BB%9F%E8%AE%A1%E6%8C%87%E6%A0%87" title="統(tǒng)計(jì)指標(biāo)">統(tǒng)計(jì)指標(biāo)表示出來(lái)的過(guò)程。在一段時(shí)期內(nèi)出生率隨經(jīng)濟(jì)水平上升而上升,這說(shuō)明兩指標(biāo)間是正相關(guān)關(guān)系;而在另一時(shí)期,隨著經(jīng)濟(jì)水平進(jìn)一步發(fā)展,出現(xiàn)出生率下降的現(xiàn)象,兩指標(biāo)間就是負(fù)相關(guān)關(guān)系。
為了確定相關(guān)變量之間的關(guān)系,首先應(yīng)該收集一些數(shù)據(jù),這些數(shù)據(jù)應(yīng)該是成對(duì)的。例如,每人的身高和體重。然后在直角坐標(biāo)系上描述這些點(diǎn),這一組點(diǎn)集稱為“散點(diǎn)圖”。
根據(jù)散點(diǎn)圖,當(dāng)自變量取某一值時(shí),因變量對(duì)應(yīng)為一概率分布,如果對(duì)于所有的自變量取值的概率分布都相同,則說(shuō)明因變量和自變量是沒有相關(guān)關(guān)系的。反之,如果,自變量的取值不同,因變量的分布也不同,則說(shuō)明兩者是存在相關(guān)關(guān)系的。
兩個(gè)變量之間的相關(guān)程度通過(guò)相關(guān)系數(shù)r來(lái)表示。相關(guān)系數(shù)r的值在-1和1之間,但可以是此范圍內(nèi)的任何值。正相關(guān)時(shí),r值在0和1之間,散點(diǎn)圖是斜向上的,這時(shí)一個(gè)變量增加,另一個(gè)變量也增加;負(fù)相關(guān)時(shí),r值在-1和0之間,散點(diǎn)圖是斜向下的,此時(shí)一個(gè)變量增加,另一個(gè)變量將減少。r的絕對(duì)值越接近1,兩變量的關(guān)聯(lián)程度越強(qiáng),r的絕對(duì)值越接近0,兩變量的關(guān)聯(lián)程度越弱。
2.相關(guān)分析的種類
1、按相關(guān)的程度分為完全相關(guān)、不完全相關(guān)和不相關(guān)
1)兩種依存關(guān)系的標(biāo)志,其中一個(gè)標(biāo)志的數(shù)量變化由另一個(gè)標(biāo)志的數(shù)量變化所確定,則稱完全相關(guān),也稱函數(shù)關(guān)系。
2)兩個(gè)標(biāo)志彼此互不影響,其數(shù)量變化各自獨(dú)立,稱為不相關(guān)。
3)兩個(gè)現(xiàn)象之間的關(guān)系,介乎完全相關(guān)與不相關(guān)之間稱不完全相關(guān)。
2、按相關(guān)的方向分為正相關(guān)和負(fù)相關(guān)
1)正相關(guān)指相關(guān)關(guān)系表現(xiàn)為因素標(biāo)志和結(jié)果標(biāo)志的數(shù)量變動(dòng)方向一致。
2)負(fù)相關(guān)指相關(guān)關(guān)系表現(xiàn)為因素標(biāo)志和結(jié)果標(biāo)志的數(shù)量變動(dòng)方向是相反的。
3、按相關(guān)的形式分為線性相關(guān)和非線性相關(guān)
一種現(xiàn)象的一個(gè)數(shù)值和另一現(xiàn)象相應(yīng)的數(shù)值在指教坐標(biāo)系中確定為一個(gè)點(diǎn),稱為線性相關(guān)。
4、按影響因素的多少分為單相關(guān)和復(fù)相關(guān)
1)如果研究的是一個(gè)結(jié)果標(biāo)志同某一因素標(biāo)志相關(guān),就稱單相關(guān)。
2)如果分析若干因素標(biāo)志對(duì)結(jié)果標(biāo)志的影響,稱為復(fù)相關(guān)或多元相關(guān)。
3.相關(guān)分析的主要內(nèi)容
1、確定相關(guān)關(guān)系的存在,相關(guān)關(guān)系呈現(xiàn)的形態(tài)和方向,相關(guān)關(guān)系的密切程度。其主要方法是繪制相關(guān)圖表和計(jì)算相關(guān)系數(shù)。
編制相關(guān)表前首先要通過(guò)實(shí)際調(diào)查取得一系列成對(duì)的標(biāo)志值資料作為相關(guān)分析的原始數(shù)據(jù)。
相關(guān)表的分類:簡(jiǎn)單相關(guān)表和分組相關(guān)表。
單變量分組相關(guān)表:自變量分組并計(jì)算次數(shù),而對(duì)應(yīng)的因變量不分組,只計(jì)算其平均值;該表特點(diǎn):使冗長(zhǎng)的資料簡(jiǎn)化,能夠更清晰地反映出兩變量之間相關(guān)關(guān)系。雙變量分組相關(guān)表:自變量和因變量都進(jìn)行分組而制成的相關(guān)表,這種表形似棋盤,故又稱棋盤式相關(guān)表。
2)相關(guān)圖
利用直角坐標(biāo)系第一象限,把自變量置于橫軸上,因變量置于縱軸上,而將兩變量相對(duì)應(yīng)的變量值用坐標(biāo)點(diǎn)形式描繪出來(lái),用以表明相關(guān)點(diǎn)分布狀況的圖形。相關(guān)圖被形象地稱為相關(guān)散點(diǎn)圖。
因素標(biāo)志分了組,結(jié)果標(biāo)志表現(xiàn)為組平均數(shù),所繪制的相關(guān)圖就是一條折線,這種折線又叫相關(guān)曲線。
相關(guān)系數(shù)是按積差方法計(jì)算,同樣以兩變量與各自平均值的離差為基礎(chǔ),通過(guò)兩個(gè)離差相乘來(lái)反映兩變量之間相關(guān)程度;著重研究線性的單相關(guān)系數(shù)。
2、確定相關(guān)關(guān)系的數(shù)學(xué)表達(dá)式。
3、確定因變量估計(jì)值誤差的程度。