2024年10月8日 星期二

描述常態分佈的特徵: 偏度與峰度




對於常態分佈(可以Histogram 畫下來) ,除了mu (mean), sigma (variance), 還可以用 Skwness 及kurtosis 來描述, 此亦可以作為特徵。

Skwness: 描述圖形是對稱分佈嗎? 還是左偏分佈 ? 或右偏分佈分佈? 



偏度 k3k_3 的計算公式:

Skewness=E[(Xμ)3]σ3\text{Skewness} = \frac{\mathbb{E}[(X - \mu)^3]}{\sigma^3}
  • 如果 k3>  0,分佈為正偏(右偏),資料分佈中有較多的數據點集中在低值區域,而右尾較長,代表有少數較大的數值偏離平均數使得 (X-u)的3次方後正更多.
  • 如果 k3 < 0,分佈為負偏(左偏),資料分佈中有較多的數據點集中在高值區域,而左尾較長,代表有少數較小的數值偏離平均數使得 (X-u)的3次方後負更多.



峰度(Kurtosis)決定數值分布的同質性與異質性,越接近高狹峰表示越同質,越趨向低闊峰表示越異質。



峰度 (Kurtosis) 的計算公式是:

Kurtosis

=1ni=1n(Xiμσ)4\text{Kurtosis} = \frac{1}{n} \sum_{i=1}^{n} \left(\frac{X_i - \mu}{\sigma}\right)^4


 標準常態分佈的峰度為 3.  為使標準常態分佈的峰度為 0,故會將原始峰度減去 3,從而更方便地比較其他分佈的峰度。也因此為峰度會有負值的原因。











 












數據分佈的尾部厚度愈厚,表示有較多異常值(離峰較遠者),故按公式計算其峰值會較大。

2024年10月5日 星期六

多變量常態分佈 Normal Distribution

Multinormal Distribution (多態性常態分佈)


當K=1 時, 即是單維的常態分佈 f(x)


若 u=0, covariane matrix= I  
當K=2 時, 為雙變數的常態分佈 PDF f(x,y)