第七百四十章 新字庫(2 / 2)

“與西方文字不同,漢字是表意文字,成千上萬的不同含義需要成千上萬的不同漢字來表示。西方文字主要是拚音文字,通過幾十個字母的組合就可以變出成千上萬的單詞。在計算機裡麵,西方文字隻需要給幾十個字母編碼就夠了,而每一個漢字都要一個編碼才行。”

“隨著時代的進步和發展,GB2312已經滿足不了應用的需要,比如‘鎔’字現在是高頻率使用字,而 GB 2312卻沒有為它編碼,因而政府、新聞、出版、印刷等行業和部門,在使用中感到十分不便。”

“所以說,隨著信息技術的發展,GB2312的6763個漢字,已經不能再滿足人們使用要求。”

“而對於蜀大中文係,曆史係,圖書館這些單位來說,六千多個漢字,更是難以滿足信息數字化的需要。”

“最近,國際標準化組織下屬編碼字符集工作組,研製了一套新的編碼字符集標準,叫做ISO/IEC 10646。”

會議室裡又是一陣驚呼。

之前說的那些都是實際情況介紹,隻要是稍微有點興趣的人,翻翻資料,都能夠說得出來。

可是ISO/IEC 10646國際標準則是國際標準化組織剛剛提出來的,而且到現在都隻頒布了一部分,這孩子已經接觸到前沿信息了。

周至繼續說道:“這是一個針對多文種處理的編碼字符集標準,目的是對世界上的所有文字統一編碼,以實現世界上所有文字在計算機上的統一處理。”

“理論上以此為基礎,我們能構建出一個在信息技術工程上通用的多八位編碼字符集,搭建出一個多文種的基本編碼體係結構。”

會議室裡已經有人忍不住舉起了手來,打斷了周至的發言:“周至同學,你是從哪裡知道我們國家正在根據ISO/IEC10646標準,準備搭建多文種基本編碼體係結構的?”

“推測啊,”周至說道:“既然GB2312已經不敷使用,自然就需要拓展;正好ISO/IEC 10646國際標準化字符集已經出台,給了漢字內碼相當大的拓展空間,因此我們自然就可以根據這個製定出擴展規範,最終得到擴展後的字庫了,難道不是嗎?”

“呃……”那人想了一下,還真就是這個邏輯思路。

麥主任介紹道:“這是我們係的李紅江教授,同時他也是國家信息技術編碼字符集工作組成員。”

李紅江說道:“我承認,肘子你說的一切都對,但你可能還不知道吧?這個事情,我們國家已經在緊鑼密鼓地展開了。”

“新的字庫,便是如你所說,將基於通用多八位編碼字符集,適應16/32位操作係統,一共擴展到23940個碼位,收錄21003個漢字。稱為GB 13000,很快就會推出了,到時候,就能夠解決漢字輸入的絕大多數問題。”

這個消息會議室裡很多人都是第一次知道,大家都興奮異常,不由得鼓起掌來。

李紅江這才笑道:“作為一名高中生,能夠找到我們國家在信息技術方麵的一個痛點,並且做了一定的研究,甚至提出了和國家相契合的解決思路,這已經很不容易了。”

說完對麥主任輕鬆地笑道:“所以說,少年強則中國強,像周至同學這樣的,是我們信息產業的希望啊!”

話雖是這樣說,其實意思也很明白,那就是這些問題國家都已經考慮過了,新編碼馬上就要出來了,就不勞你一個高中畢業生來操這份心了。

周至一直靜靜地等待李紅江說完,然後才說道:“兩萬一千個漢字,就能夠解決問題了嗎?”

“兩萬一千零三個!”李紅江強調道:“從六千多個擴展到兩萬一千零三個,擴展了三倍多,這是多大的成就和進步?”

上一頁 書頁/目錄 下一章