2020年6月15日

資訊圖表視覺化(1)-科展報告書內的圖表修正以及視覺化原則

最近開了一個線上課程,在教老師們如何「以Excel繪製圖表」。

Excel畫圖?這太簡單了吧。實際上並不簡單,讓我們先以科展報告裡的圖片來說明,我會呈現原始的圖片,並隨後呈現修改後的圖表。你可以先看看前後的差異,最後我們再來說明在學術發表時的圖表中應該注意的事項。

這些圖片是我在最近一次研習中,請老師們利用我彙整的科展資料庫去找的

出處【致命的危機~探討蟲生真菌對疣胸琉璃蟻的致死情形】,原圖

ants1

修正後
ants2



出處【杯中乾坤大,籟中樂音揚-回授音的研究】,原圖

freq1

修改後
freq2




不知出處,原圖
mg1

修改後
mg2


出處【「油色可鑑」-簡易比色卡與發煙點之間的奧秘】,原圖

oil1

修改後
oil2



出處【台灣欒樹-探討蒴果與果瓣對種子成長與擴散模式的關係】,原圖。僅針對左邊三張圖整合修改。
欒樹0


第一種修改方式,以實際數量看分布狀況。會因紅色種子總數較少,而不容易比較趨勢。欒樹1


第二種修改方式,改以機率密度看分布狀況
欒樹2


第三種修改方式,以類似直方圖的方式呈現。將三種顏色的種子呈現在一張圖
欒樹3 


第四種修改方式,是以直方圖的組圖方式呈現資料
欒樹4


資料該用什麼圖呈現?
在科展研究中,使用最多的圖形包含以下三大類:
  • 點:散佈圖
  • 線:折線圖或是呈現趨勢線或相關的散佈圖
  • 面:直條圖、橫條圖、直方圖

散佈圖看的是每一個數據點在兩個變量之間的分布情形。它可以用來呈現兩變量之間的關係,例如兩變量是線性關係,則數據點會沿著對角線而變化。一般圖形的上邊框和右邊框可以不呈現,但是散佈圖通常會呈現邊框,而且其橫軸和縱軸的長度比例通常相等。

折線圖是用來呈現交互作用,表示一個或多個應變變因如何隨著操縱變因變化而變化。X軸是操縱變因,Y軸是應變變因。它也可以用來呈現隨時間的趨勢,但是在EXCEL中僅適用日以上的時間序列。若是「時、分、秒」需用散佈圖。XY軸長度比例通常Y軸是X軸的2/3或 3/4。呈現的線條最好不要超過四條。若有許多條曲線可考慮用組合圖或其他方式表示。

長條圖可以對比組與組間的數據,而直方圖是用來呈現頻率分布。X軸是被分類的數據,例如高度、年齡、年度。X軸的變量要從小到大排列。


至於圓餅圖,盡量不要用,因為通常用長條圖即可呈現圓餅圖的資料,且能避免圓餅圖的缺點。

舉例來說,請辨識下圖的圓餅圖中,A、B、C三者的大小關係?同樣的資料若以長條圖來繪製,則可一目了然大小差異。

圓餅圖也並非沒有優點,你可試試看從圓餅圖和長條圖中,回答「C和D加總後是否有超過一半的比例?」。雖說這類型的問題是圓餅圖的長處,但多數情況用長條圖即可。
圓餅圖



視覺化的原則
  1. 同一文件中的所有圖,有一致的大小、標註、字體、圖例形式。
  2. 圖和正文足夠靠近,圖說(或圖註)和圖要在同一頁。
  3. 圖說中的標題將圖表描述清楚。
  4. 圖中若使用了標準差、標準誤或是誤差區間,要在圖說中進行說明。
  5. 圖說中寫清楚樣本數量、統計方法。
  6. 圖說的字體和正文字體相同。
  7. 通常圖例可以直接用標籤直接標示在資料點或線條。如果需要圖例,則要把圖例放在圖像內部。
  8. 彩色圖形轉成灰階之後,仍可辨別清楚。
  9. 圖的填色可使用黑、灰、白。
  10. 不要使用太密的網格線,有些格線可以省略。
  11. 當一個圖中有兩條或兩條以上的線條時,改變線條樣式或數據點的標記以區分線條,特別是線條之間有交叉或重疊時。
  12. 組合圖的圖例和X軸標題只呈現一次。通常圖例在最上方,X軸標題在最下方的圖形呈現。
  13. 需要比較的圖形可以組合排列在一起,適當省略X軸或Y軸的數值、類別標籤、軸線。
  14. 一張圖中若含有兩張子圖,在子圖的左上角用大寫字母加以標註。
  15. 評估每一張圖的大小方式,一頁A4放入6張同樣的圖,每張圖還都要能清晰可辨。

科展報告裡的圖片常犯的錯誤或應修正之處:
  1. 使用錯誤的圖,例如用折線圖來呈現相關性、將非連續變項繪製成折線圖
  2. 圖例未直接標示於線段上,讀者須來回掃視畫面元素才能理解
  3. 刻度太多或數值未調整,顯示雜亂。
  4. 圖說或圖註不完整,讀者需閱讀報告正文才能了解圖表意義
  5. 圖表解析度太差。原因有二,以jpg格式儲存圖檔時,因破壞性壓縮而使畫面出現雜點,或是儲存為pdf時,未修改圖片壓縮解析度,使得儲存時以最低壓縮率儲存。

初學者在繪圖時,應該先試著用紙筆畫出簡圖之後,再用繪圖軟體繪製。初學者若沒有經過此一階段,而直接以電腦繪圖,往往會遷就於軟體的預設值,而畫出災難性的圖表而不自知。