虛擬變量
百科 > 虛擬變量
1.什么是虛擬變量[1]
虛擬變量又稱虛設(shè)變量、名義變量或啞變量,用以反映質(zhì)的屬性的一個(gè)人工變量,是量化了的質(zhì)變量,通常取值為0或1。引入啞變量可使線形回歸模型變得更復(fù)雜,但對(duì)問題描述更簡(jiǎn)明,一個(gè)方程能達(dá)到倆個(gè)方程的作用,而且接近現(xiàn)實(shí)。
例如,反映文程度的虛擬變量可取為:1:本科學(xué)歷;0:非本科學(xué)歷
一般地,在虛擬變量的設(shè)置中:基礎(chǔ)類型、肯定類型取值為1;比較類型,否定類型取值為0。
2.模型中引入虛擬變量的作用[2]
1、分離異常因素的影響,例如分析我國(guó)GDP的時(shí)間序列,必須考慮“文革”因素對(duì)國(guó)民經(jīng)濟(jì)的破壞性影響,剔除不可比的“文革”因素。
2、檢驗(yàn)不同屬性類型對(duì)因變量的作用,例如工資模型中的文化程度、季節(jié)對(duì)銷售額的影響。
3、提高模型的精度,相當(dāng)與將不同屬性的樣本合并,擴(kuò)大了樣本容量(增加了誤差自由度,從而降低了誤差方差)
3.虛擬變量設(shè)置的原則[2]
在模型中引入多個(gè)虛擬變量時(shí),虛擬變量的個(gè)數(shù)應(yīng)按下列原則確定:
如果有m種互斥的屬性類型,在模型中引入(m-1)個(gè)虛擬變量。
例如,性別有2個(gè)互斥的屬性,引用2-1=1個(gè)虛擬變量;再如,文化程度分小學(xué)、初中、高中、大學(xué)、研究生5類,引用4個(gè)虛擬變量。
評(píng)論 | 0條評(píng)論
評(píng)論