2020年6月15日

資訊圖表視覺化(4)-描述資料的方式,平均值、標準差與資料分佈

要描述你的實驗數據,直覺想到的就是平均值,所以大家就會用長條圖來繪製平均值。但是平均值表現的只有集中的趨勢,兩群平均值相同的資料,不代表他們資料分佈都會相同。所以我們還需要描述它們的分散程度。

描述分散程度,一種是利用誤差線畫出標準差,還有一種就是用組合圖的方式把資料以抖動(jitter)的方式和長條圖組合起來,如此一來就可以在圖上觀察到集中和分散的兩種趨勢。

在繪製標準差的誤差線時,也要注意需要在圖註或圖說中寫清楚,誤差線代表的是標準差,還有其樣本數為多少。
描述數據的方式



描述數據還可以用中位數、全距等,所以也可以繪製盒狀圖(或稱盒鬚圖)來描述這群數據。
盒鬚圖


此外,直方圖也是用來描述數據的工具之一。

欒樹4



此篇文章的教學內容在此影片,講述了標準差的意義,以及抖動散佈圖如何和長條圖結合