“嗯,現在睡覺,等回去我們就開始這項工作。”
“好。”
這項工作是周至答應過辜老的,當時周至曾經跟辜老說過,如果等到他進入大學,國家依舊沒有推出相應的字庫的話,那這項工作便由他來完成。
當然在沒有設計軟件的情況下,前期的準備工作隻能用手工,那注定將是繁瑣的。
僅僅是將近五萬個漢字複刻到十六乘十六的三十二比特信息量的柵格當中去,在沒有軟件輔助的情況下,會是非常耗時且枯燥的工程。
這項工作還相對簡單,且隻是基礎。
有了基準字模之後,才談得到利用軟件和基礎字型設計,通過數字化擬合,自動生成不同的字體。
但是隻要將基礎工作做好,剩下的就可以通過計算機軟件來完成了。
周至在前期已經做了一些工作,主要就是將GB 2312—1980的簡化字和康熙字典繁體字結合到一起,構成這個字庫所需的全部漢字。
至於附加的英文字母和常用字符,已經不屬於他的專業了,將來讓彆人補充就好。
兩相結合再去除重複,馮雪珊信口說的五萬字,其實和事實非常接近。
周至之所以想要插手這件事兒,是因為現在的國人對這個事情沒有什麼經驗,因此走入了一個誤區。
漢字是象形文字,和拉丁字母的區彆就在於字碼太多。
如今主流的做法,就是簡化,隻將常用字列入輸入法中,以應對絕大多數時候的需要。
但是周至認為,這樣的做法並不太好,因為占用存儲空間的其實是五萬個字的字模,而並非代表它們的編碼。
因此大可以一步到位,將大中華區包括港島、寶島、新馬、島國、朝國等依舊在使用漢字的地方,以及使用大量漢字符號的地方,將所有字型都收集起來,先將大字庫編好。
具體到再上一層的應用,則可以通過從基準字庫中提取子集的方式來完成。
一開始的時候大字庫肯定隻有專業的印刷廠,出版社才用得上,今後隨著存儲設備價格的狂降和設備容量的指數級擴充,存儲空間不再是卡個人電腦價格的瓶頸後,最終這套字庫還是能夠走入千家萬戶。
這個設計思路就從傳統西方的設計思路當中跳了出來,也不再僅僅是頭痛醫頭腳痛醫腳,而是一步到位,以免在今後不斷再升級調優換版本。
然而搞笑的是,這件事情即便在周至重生之前,國家都沒有完成。
這就是工科典型的實用主義和文科典型的理想主義之間的思路差異,也是國人在設計字庫的時候,少了文科學者跨學科參與聯動發揮影響力造成的。
不能不說最終這成了一個遺憾,將華夏所有文字納入一個電腦字庫,這件事情值不值得做呢?
答案是顯而易見的,隻不過急於追趕世界文明數字技術大發展的華夏一族,現在還一切從實際出發,腦子裡想的就倆字——“能用”,還顧不到這上頭來。
如今甚至已經有了一種預言,那就是未來的信息化世界裡,將沒有漢字的存在;這門美好的語言,最終會在信息世界裡消失;而華夏民族,也會因為使用如此複雜的象形化文字,在信息科技的大發展中,再次淪為落後民族。
而周至想要告訴那些人的,是你們全特麼在放屁。