特征值和特征向量是干嘛用的(特征值和特征向量有什么作用)
特征值和特征向量具有良好的性質(zhì),是線性代數(shù)中的重要概念之一。它們?cè)诙嘣y(tǒng)計(jì)分析方法中也有重要的應(yīng)用。
在數(shù)學(xué)中,特別是在線性代數(shù)中,A是一個(gè)n階矩陣,如果數(shù)個(gè)和n維非零列向量v,滿足Av=v,那么數(shù)稱為A的特征值,v稱為A的對(duì)應(yīng)于特征值的特征向量。
在多元統(tǒng)計(jì)中,特征值和特征向量主要在PCA主成分分析和FA因子分析中發(fā)揮作用。
主成分分析中
特征向量的正交化確保主成分具有成對(duì)獨(dú)立的屬性。單位化使得主成分表達(dá)式中線性組合的系數(shù)更加簡單;主成分的方差等于構(gòu)成線性組合的特征向量對(duì)應(yīng)的特征值。特征值之和等于原始變量的方差之和,這意味著所有主成分準(zhǔn)確地反映了所有原始變量的所有信息。在選擇主成分的過程中,特征值通過限制方差貢獻(xiàn)程度來控制包含更多信息的主成分。特征向量彼此正交。
特征值之和=矩陣R的跡(主對(duì)角線元素之和)=總方差。
特征值的乘積=矩陣的行列式值=廣義方差。
因子分析中
特征值和特征向量用于估計(jì)因子模型,在對(duì)應(yīng)分析中用于計(jì)算因子載荷矩陣。進(jìn)一步解釋特征值/向量的作用,本文假設(shè)一個(gè)雙變量模型。
給定相關(guān)系數(shù)矩陣R,從中得到2對(duì)特征值和特征向量。
特征向量描述了這個(gè)橢圓的兩條軸的方向。橢圓軸的半長和特征值的平方根是成比例的。所以,在2個(gè)變量時(shí),特征值比較大的特征向量對(duì)應(yīng)的就是長軸方向。因?yàn)檫@里只有2個(gè)維度,所以是一個(gè)平面圖形。
在原始坐標(biāo)系中,每個(gè)樣本對(duì)應(yīng)一個(gè)水平和垂直坐標(biāo)?,F(xiàn)在我們有了特征向量,我們沿著特征向量的方向繪制兩個(gè)新軸,即圍繞橢圓創(chuàng)建新軸。因?yàn)檩S沒有變化,所以每個(gè)樣本到軸的距離也沒有變化。僅水平和垂直坐標(biāo)發(fā)生變化。
由于軸的順序基于特征值的大小,因此在解釋樣本變化的方向時(shí),首先排序的軸更為重要。
實(shí)例:
如下圖所示,特征值之和為2。但是每張圖片的特征值和特征向量不同。
左:兩個(gè)特征值非常接近,因此橢圓的兩個(gè)軸的長度相似。因此,樣品的分散位置接近于圓形。1稍大,所以紅軸稍微重要一些,我們可以推測可能存在一些負(fù)相關(guān),但它也很小,接近于0,幾乎不相關(guān)。
中:1對(duì)應(yīng)紅軸,負(fù)方向。2對(duì)應(yīng)于綠軸,即正方向。12,推斷負(fù)相關(guān)是更常見的趨勢,但也存在正相關(guān),因此這描述了中度負(fù)相關(guān)。
右圖:1遠(yuǎn)大于2。說明紅軸所代表的正相關(guān)性非常強(qiáng)。沿著綠軸,可以發(fā)現(xiàn)樣本變異程度很小。因此,推斷該樣本之間的正相關(guān)性仍占主導(dǎo)地位。