重生之乘風而起(二子從周)_第七百四十二章新方案（2 / 2）_重生之乘風而起最新章節免費閱讀無彈窗

“當前全收集，則指當前我們已知的漢字符號，包括大陸簡化字，寶島、港澳、新島的繁體字，還有島國，朝韓所用的一些漢字符號，全部采納到新編碼體係中來。”

“未來可拓展的意思，就是要給字庫留夠充足的冗餘編碼空間，給將來采集更多的文字符號做好準備。”周至侃侃而談：“剛剛旦增大師已經說了，我國是多民族的國家，很多民族都有自己的文字，這些文字，同樣是我們華夏一族大家庭的瑰寶。”

“因此我們要留足這個字庫的拓展空間，以備將來時機成熟後，將這些少數民族的文字也收納進來。”

“這就是我的設想，關於華夏標準大字庫的設想。”

“呃……周至同學。”李紅江倒也是光棍：“我給你道個歉，也給辜老和旦增大師道個歉，之前自己的確沒有意識到這個問題的重要性。”

“但是我之前已經說了，GB 13000是根據ISO/IEC 1064來設計的，通用多八位編碼字符集的碼位就隻有兩萬多個，就好像一個養殖場，雞籠子就這麼多，實在是裝不下你們說的這麼多雞啊？”

“所以說這個多八位編碼字符集是有問題的呀，不適合中國的需要呀，那我們為什麼還要湊合著用呢？”周至反問道。

“要是不用這個，那又用哪個呢？”李紅江倒是不覺得周至是在無理取鬨，能夠提出問題來不是本事兒，關鍵是問題提出來之後，你還得能夠解決問題才算。

“為什麼不用UNICODE呢？”

“UNICODE？”李紅江想了一下：“UNICODE八字還沒一撇吧？國際標準都還沒有出來，我們哪來的參照？”

Unicode的漢語翻譯，叫做統一碼，也叫萬國碼、單一碼，是由統一碼聯盟開發的一項計算機科學領域裡的業界標準，主要就包括字符集和編碼方案。

統一碼是為了解決傳統的字符編碼方案的局限而產生的，它為每種語言中的每個字符，設定了統一並且唯一的二進製編碼，以滿足跨語言、跨平台進行文本轉換、處理的要求。

統一碼設計之初的目的，就是為了打造一個能夠容納世界上所有文字和符號的字符編碼方案。

其設計思路，就是用數字0-0x10FFFF來映射所有字符，最多可以容納1114112個字符，或者說有1114112個碼位。

後世大家所熟悉的UTF-8、UTF-16、UTF-32，其實都是將數字轉換到程序數據的編碼方案。

當然這些碼位也不是隨便亂用的，而是規定了區間，比如上一世給漢字使用的區間，就是3400-4DBF，4E00-9FFF，20000-3FFFF三段，稱作：中日韓越統一表意文字區間。

這就有一百多萬個碼位，裝下所有漢字綽綽有餘。

因為不存在上限，UTF理論上還可以繼續擴展。

當然從上一世的經驗來看，也完全沒有這個必要，足夠用了。