“是嗎?”周至說道:“那為何我研究過一些關於文字係統的論述,結果發現一般中文應用係統,也需要一萬三千個左右的漢字;而大型的中文應用係統,則需要兩萬三千個左右的漢字;政府機關的專用中文應用係統,則需要四萬八千個左右的漢字;而大型圖書館用的中文應用係統,需要的漢字可能超過十萬呢?”
“哪裡這麼誇張?”李紅江是計算機信息技術的大拿,然而對漢字編碼也是半路出家,對於編碼算法,字庫編程,函數耦合等技術性的東西有豐富的經驗,然而大型圖書館需要超過十萬的漢字這種概念,也徹底顛覆了他的認知。
“的確有這麼誇張。”辜老說話了:“光康熙字典,就有四萬七千零三十五個漢字,也就是說,如果我們圖書館要對康熙字典進行數字化采集,你們這個還沒有投入的GB13000,將有一半的漢字,在係統當中顯示不出來。”
辜振鐸也開口了:“我主持編纂的《漢語大字典》,收入的單字也有五萬六千個,如果用GB2312標準,隻夠一個零頭,如果用GB13000,也隻夠一小半。”
旦增大師作為曆史係的重要人物,今天也參與了這個會議,這時候也說道:“大家不要忘了,我們祖國是一個多民族的國家,除了漢語以外,還有藏文,蒙文,壯文,維吾爾文等十多種文字,這些少數民族文字的信息化編碼工作,也是應該要納入考慮的。”
辜振鐸聽著都覺得有些過分,這最大最主要的語種都還沒有搞定呢,哪裡顧得到其他,於是說道:“這個要求也實在太苛刻了,得讓搞信息技術的同誌們一步步來嘛……”
“還不止這些啊!”旦增不退反進:“除了少數民族文字,還有古代文字呢,比如甲骨文,啊甲骨文不算,可以算作一種字體,但是突厥文,回鶻文、於闐文、西夏文,這些不能不算吧?”
“旦增主任,我們先解決主要矛盾,主要矛盾。”麥主任聽得頭都大了:“次要矛盾先放一放……”
“不用放,無解。”李紅江將手一攤:“碼位就好像放字的盒子,碼位就那麼多,因此能放的字也就那麼多,GB13000標準兩萬一千零三個漢字,是我們經過辛苦的研究才搞出來的。”
“況且我們使用GB2312編碼這麼久了,除了一些生僻字以外,還是基本能夠滿足需要的嘛,這麼多年都這麼過來了,現在又擴展了這麼多,應該滿足絕大多數應用場景了嘛。”
“哈哈哈哈……”辜幼文聽到這個說法,不禁沒有生氣,反而像聽到一個懵懂的孩童講出無忌的童言那般給逗樂了:“小王是理科生,以前是搞數學的是吧?所以你有這個想法我們也不怪你。”
“我給大家講一個曆史故事吧。”
“大禹治水的故事,大家都知道吧?”
所有人都是點頭。
“那大禹的父親,因為治水失敗而被舜殛死於羽山的鯀,大家知道嗎?”
這下理科參會者那邊,點頭的就少了一半。
“大禹的父親,名字叫鯀,鯀字有三種寫法,大家知道嗎?”
這回連文科這邊的教授都有不清楚的了。
“肘子,你來講。”辜老將裝逼的機會留給了周至。
周至隻好接著:“鯀字有三種寫法,一種是大家熟悉的,一個魚,一個係;第二種是一個魚,一個玄;第三種是一個骨,一個係。”
“鯀是禹的父親,相傳為顓頊之子,一說顓頊五世孫,姒姓,字熙。居於今河南嵩山一帶,當時是崇地,所以稱有崇氏,又稱崇伯。”