2021年6月14日

國中小的各科教科書版圖

曾經聽過有人說某些版本教科書在不同縣市會有不同的青睞度,但究竟是怎樣?我也好奇各家出版社的市佔率究竟是如何?

因為疫情所以健身房關閉,我呢就動不動就在寫程式,正好看到康軒有一個網頁可以查詢各校選用的教科書版本,於是我一時興起,就寫一個python爬蟲把資料爬下來。總計爬到的學校數量,國中小合計有3643所,然後我再做一下資料清洗,把每校每年級各領域選用的教科書整理成tidy data,共計114653筆。

然後就可以開始來解決我好奇的問題了,教科書版本的各縣市市佔率是如何呢?

我用縣市為單位區分,就像分析選舉投票率一樣,畫圖當然不可能直接用學校數來畫,因為各縣市的學校數就不同啊。所以我就改用比例來計算,票數用的是年級數,而不是學校數,比如說某個版本、某個領域,在一個學校裡有兩個年級選用,那就算拿到兩票,以此類推。

結果出爐,果然有些版本在某些縣市的市佔率真的很高。

對原始資料有興趣的,可以在這個github上搜一下https://github.com/ChihHsiangChien/textbookMarketShare/tree/main/%E5%88%86%E6%9E%90%E7%B5%90%E6%9E%9C


本來蒐集完資料後,是用qgis去畫圖,不過手工設定太麻煩了,後來我就改用python的 geopandas來畫圖了,這樣就快多了。

提醒一下這些圖都是 109學年度下學期的資料,也就是快要過期的資料了。