第243章 彈幕文化(2 / 2)

“在互聯網時代,漢字輸入不吃虧,起來還有優勢,還記得先前提到的漢字的優點吧,這裡引入一個概念,信息熵,記好筆記,後麵會用到。”

陳博記得十分從容,落筆絲毫不慌,甚至還饒有興致的練起了正楷,和大多數老師的講課方式並無兩異,要麼是照本宣科故意拖慢節奏念ppt,要麼是結合各種時政熱點抖機靈講段子。

兩者的共同點是一節課裡真正要記的東西其實不多,但為了水課時,隻能想儘法子混。

“我國的視頻節目做視頻的時候就加上字幕的比例,遠高於歐美,也比日本高,可能和中國互相不通的方言眾多也有關,十裡不同音,百裡不同俗。”

“我國的觀眾習慣在視頻節目中看字幕,因而古風歌曲、鬼畜才可能流行,因為沒有字幕是很難光靠聽聽懂的這類作品的。”

“有人說彈幕都是短語,不需要什麼語法,外文彈幕網站也完全可以形成自己的文化,使用各種簡寫,這裡我們上一個對比視頻,同樣的彈幕內容,英文呈現出來的觀感是不是明顯差了點。”

陳博順手截了個圖,雖然英文彈幕的密集程度遠不如中文,可字母間的遮擋嚴重影響了對彈幕內容的判斷,反觀中文彈幕這邊,密密麻麻的字幕絲毫不影響陳博提取出彈幕內容。

漢字的倒序亂碼在一定程度上不會影響讀者的體驗,但丟失單個關鍵字符就波及整體,例如我去找他要钅,到底是要什麼,要錢還是要鐵要銅。

這點在英語方麵恰恰相反,即便丟失了一部分後綴前綴,仍然不會影響對句子的整體理解,正是因為英文單個字符所提供的信息量較少。

“根據最新出版的各語言信息熵目錄,漢字單個字體的平均信息熵在9.68左右,而英文的信息熵則在3.23徘徊,信息熵越高,代表越無序,關於信息熵的計算過程,有興趣的同學可以看看下麵的公式和延伸。”

陳博順著老師的指引點開鏈接,馬上被一堆不知所雲的公式下愣在原地,他借助看得懂的文字說明,試著對這些陌生的公式進行解讀。

語言自身所擁有的符號越多,信息熵越大,英語字母看起來有26個,實際上能組合起來的單詞不多,以大學英語6級為例,要求掌握的隻有6000個,且句子間有特定的組合形式,前後彼此的關聯度較高。

中文字符中最高關聯度的是“的”,出現頻率也僅在5%左右,而英文單詞“is”則占了13%,較低的關聯度使得漢字更難讓人揣度前後文,換言之,學習者們能難猜到一個句子下一個出現的字會是什麼。

數學公式擁有著比漢字更高的信息熵,這世界上沒有什麼比公式更簡潔明了的揭示真理的東西了,一條簡單的數學式子,幾個特殊的字母符號便能讓人畫上兩三頁紙去解釋其究竟是何含義。

“彈幕文化自古有之,我們古人不是經常喜歡做批注,前人寫的文章著作,今人讀完免不得在旁邊加點自己的理解感悟,從某種程度上來說,這算是彈幕文化的雛形。”

剛剛被海量專業術語衝擊的陳博總算能重新回到人類能聽懂的語言頻道,他撰筆的手微微發顫,字體也不如先前那般工整了。

注:彈幕文化這節課真不好上,又教語文又教數學,順便來點曆史增加厚重感,五星差評,分期付款。

上一頁 書頁/目錄 下一章