第七百四十三章 我也用得(1 / 2)

但是上一世的漢字編碼也有問題,那就是Unicode編碼問世得太晚,導致了微軟不得不采用一套基於GB13000的拓展編碼,又因為這個原因,導致國家標準又不得不在GB13000編碼基礎上打了個打補丁,拓展出GBK,然後又拓展出GB18030。

最終得到的GB 18030-2005,全稱為國家標準 GB 18030-2005《信息技術中文編碼字符集》,與 GB 2312-1980完全兼容,與 GBK基本兼容,支持GB 13000及 Unicode的全部統一漢字,共收錄漢字70244個。

而在那個時候,Unicode的漢字收錄得還沒有GB 18030-2005多,雖然理論上隨便裝得下所有漢字,但是無數的碼位都是空的。

最後的現狀,就搞成了一個舊係統補丁累補丁,而一個新係統空著大量碼位沒人去做填充工作,造成了數十年後信息係統當中,依然存在漢字轉碼不全兼容的大問題。

後世作為國企程序員的周至可謂深受其害,因此他認為解決這個問題的關鍵,就是國家從一開始就應該放棄局促的ISO/IEC 1064,先去把Unicode標準中的漢字空間搶得夠夠的,起碼先搶十萬個碼位填充上,並且將之作為唯一強製標準,全球就用這一套。

於是說道:“八字沒一撇不是正好嗎?八字沒一撇,我們才能夠深度參與啊。隻要能占有三段碼位空間留給我們,就能容納十萬漢字。”

“而且Unicode隻有編碼的概念,其設計的目的本身就是裝下全世界的各種文字。”

“漢字編碼,無疑是全世界文字編碼工作當中最繁複的,我們將這個工作做下來,在組織裡也能擁有充分的話語權,將來還能指導其他國家和組織工作,對我們編寫其餘民族文字,也有奠基作用。”

現在周至和李紅江討論的內容,又輪到辜老這邊的文史專家們聽不懂了。

辜老打斷了兩人的熱烈討論:“肘子,小李,你們誰先用我們老頭們聽得懂的話解釋一番?”

麥明川笑道:“大概的意思我明白了,我先來解釋一下看看對不對,不對小李和周至同學再來補充。”

“現在的話有兩套標準,一套是ISO/IEC 1064,這套體係已經成熟,雖然之頒布了第一部分,但是我們國家已經據此開發出GB 13000,可以快速推行。”

“但是這套係統有個大毛病,就是碼位太少,隻能容納下兩萬一千零三個漢字,現在看來離完全滿足需要,還有一段相當大的距離。”

“另外還有一套標準,就是Unicode。”

“這套標準隻要分配給漢字的編碼區間足夠,就能夠容納下我們所有的漢字,而且今後還可以繼續拿下更多的編碼區間,進行進一步的拓展,或者用於給其餘少數民族文字編碼所用。”

“從設計原理來看,Unicode標準其實是優於ISO/IEC 1064的,然而這個標準現在還隻是一個半吊子,第一版都還沒有推出來,如果我們要使用Unicode標準的話,先得將標準完善,之後才談得到區間分配和下一步的工作。”

“小李的意思,是咱們先將GB 13000用起來,之前已經有了搞GB2312的基礎,搞這個路子熟,見效快。”

“而肘子的意思,是我們一開始就搞Unicode,一步到位,既然Unicode標準還沒拍板,那我們就積極參與進去,連標準一起搞!”

“要是真的能夠做到肘子所說的這樣當然是最好的結果。可是,我們有那個實力嗎?”辜老對國家信息產業起步猛追的印象還是有的,擔心的是憑借國家現在的技術力量,完不成這項工作。

上一章 書頁/目錄 下一頁