2023年1月2日

學生名字有沒有唸起來越來越像呢?

 「我們班的學生名字都好像喔,不小心就會叫錯啊」

某天偶然聽到辦公室老師說起這句話,這引起我的好奇心。因為最近剛好也有同樣的感覺,那是開學前拿著學生名單看的時候,我們總是會一個一個先唸一下,看看有沒有不會讀的音。那時候就發現大家名字唸起來都很像,而且男生女生之間唸起來也都一樣,只是字不同而已,而且有些是第二字和第三字顛倒。

然後想想,好幾年前好像沒有這麼強烈的感覺,難道最近學生的名字唸起來越來越像了嗎?但由於我們的記憶本就有時近效應,對於最近發生的事情本來就記得清楚,這種感覺也有可能是錯覺。

為了解答這個疑惑,所以我就把以前學生的檔案翻出來,統整了每年七年級學生的姓名,然後用python的套件把姓名的第二字和第三字的讀音解析出來分析。

先說結論,果然現在學生們的姓名讀音比起以前的確是越來越像了,也就是讀音的多樣性降低了,而這也和學生總人數減少有關係。




這裡用到了資訊熵(Information Entropy)來分析。資訊熵的數字等同於「平均要問多少yes/no的問題才猜得出姓名的讀音」,如果大家的讀音都一模一樣,那就沒什麼好問的,資訊熵就等於0,而如果大家的讀音越不相同,你就要問越多問題才能得到答案。如果全部姓名讀音的出現頻率完全相同的話,那麼以這幾年的數據來算,資訊熵理論最大值是在9-10之間。但實際計算後,看到資訊熵其實是越來越低的。其實,資訊熵在生態學實驗裡也有拿來應用,這其實就是在計算生物多樣性時使用的Shannon指數。

那麼唸起來到底有多像呢?我拿最近一年的資料來說吧。前五名的ㄩˇ、ㄔㄥˊ、ㄧˋ、ㄊㄧㄥˊ、ㄐㄧㄚ,每一班一定都有人的名字裡有這樣的音!


手邊的資料是從民國98年起的,就把它們整合起來作視覺化整理,看看這些讀音的排名變化吧。