2024年10月8日 星期二

描述常態分佈的特徵: 偏度與峰度




對於常態分佈(可以Histogram 畫下來) ,除了mu (mean), sigma (variance), 還可以用 Skwness 及kurtosis 來描述, 此亦可以作為特徵。

Skwness: 描述圖形是對稱分佈嗎? 還是左偏分佈? 或右偏分佈分佈? 指大部份的數值落在平均數的左邊或右邊







正偏態分配(positive skewness):數值較集中在低分部分,即平均數左邊的數值較多,表示考低分的人較多;負偏態分配(negative skewness):其數值較集中在平均數的右邊,表示考高分的人較多


偏度 k3k_3 的計算公式:

Skewness=E[(Xμ)3]σ3\text{Skewness} = \frac{\mathbb{E}[(X - \mu)^3]}{\sigma^3}
  • 如果 k3>  0,分佈為正偏(右偏),表示數據右側異常值很多大於均值, 3次方後正更多。
  • 如果 k3 < 0,分佈為負偏(左偏),表示數據左側異常值很多小於均值, 3次方後負更多。

峰度(Kurtosis)決定數值分布的同質性與異質性,越接近高狹峰表示越同質,越趨向低闊峰表示越異質。



峰度 (Kurtosis) 的計算公式是:

Kurtosis

=1ni=1n(Xiμσ)4\text{Kurtosis} = \frac{1}{n} \sum_{i=1}^{n} \left(\frac{X_i - \mu}{\sigma}\right)^4


 標準常態分佈的峰度為 3.  為使標準常態分佈的峰度為 0,故會將原始峰度減去 3,從而更方便地比較其他分佈的峰度。也因此為峰度會有負值的原因。

數據分佈的尾部厚度愈厚,表示有較多異常值(離峰較遠者),故按公式計算其峰值會較大。
 







沒有留言 :

張貼留言