王正陽仔細的整理了一番自己的語言,想了想說道:“先從語言說起吧,漢語相比起英語來,有很多優勢。”
“漢語文字精煉,言簡意賅,冗餘度低,以最少的符號表達最豐富的含義,我們從信息學的角度予以闡述,漢字、西文字母作為語言文字的最基本單位,用以構成詞彙、句子,傳達一定的信息,是信息的載體,如何對每一個漢字、字母所負載的信息進行度量?”
“現代信息學用熵來衡量平均信息量,熵表示指定符號出現的不肯定性。西文字母采用的拚音文字字母有30個左右,漢語以方塊字為書寫單位,數目成千上萬,顯然其隨機出現的不肯定程度比西文字母的不肯定程度要大得多,從這一角度講每個漢字載荷的信息量遠遠大於一個字母的信息載荷量。”
“我們經過統計計算,得出法語字母的零階熵值為3.98比特,意大利字母零階熵值為4.00比特,西班牙字母零階熵值為4.01比特,英語字母的零階熵值為4.03比特,德語4.10比特,羅馬尼亞語為4.12比特,俄語為4.35比特。”
“英語詞的零階熵為10.0比特,漢語詞的零階熵為11.46 比特,這表明漢語的詞義也比英語豐富。”
王正陽一邊說,旁邊有人開始打開投影儀,播放出他們對漢語和英語差異方麵的研究成果。
“因為我們的漢語太過言簡意賅,一個字、一個詞表達的意思太豐富了,同樣的一個字一個詞在不同的場合下,語氣下,意思就完全不一樣。”
“因而由漢字組成的句,它的意思就更加的豐富,往往非常簡單的一句話,它卻是擁有多個意思。”
“比如能穿多少是多少?”
“這一句非常簡答的話,它就有兩種意思,一種是儘可能的多穿衣服,一種是儘可能的少穿衣服,兩種意思完全不同,可是偏偏又是同樣的一句話。”
“本來語言精簡是非常不錯的一件事情,但是在計算機領域內,因為計算機從根本上來說,它是一種精準的計算。”
“意思表達不明確,它就根本沒有辦法去計算。”
“相反英語就比較冗長,但是冗長歸冗長,冗長度高的語言結構性好,語言信息表達精確,糾錯能力強,利於計算機的計算、編程等等。”
秦毅仔細的聽著,王正陽講的這些東西一聽就懂,對於計算機也深入學習過的秦毅自然就明白。
“據我所知,程序編碼的過程當中是儘可能的要求精煉,按理來說我們漢語的優勢應該是更明顯才對。”
聽到這裡,秦毅想了想提出了自己的疑惑。
“你說的不錯,從計算機發展的曆程來說,編程方麵一直都要求精煉,特彆是在計算機剛剛發展起步的時候,因為存儲容量有限,編碼都是儘可能的精煉。”
“這就好比是我們古代,在還沒有發明紙張之前,書寫僅僅隻能夠在羊皮、竹子上麵的時候,因為書寫材料製作不已,所以書寫的時候都儘可能的簡練,於是有了我們現在的文言文。”
“但是精煉歸精煉,計算機說到底還是一種運算,一種計算方式,精煉也要表達出準確的意思才行,我們漢語意思太豐富,精煉是絕對夠,但表達的意思太過豐富,它對於計算就帶來了巨大的困擾。”
聽到秦毅的話,王正陽點點頭,他是計算機文字信息處理方麵的專家,對這些東西都很懂。
“那這樣說來,漢語編程和漢語係統是不可能實現了?”
聽到這裡,秦毅忍不住皺起了眉頭,聽這王正陽的話,總覺得讓人比較鬱悶外加氣憤,心裡麵都考慮著要不要換過一個人過來主持這個工作。
這還是秦毅第一次動了換人的年代,一直以來秦毅都沒有換過任何一個研究單位的負責人,但是這次,秦毅真的有點動了這個年代了。
“不~這英語可以實現,我們漢語也可以實現。”
“因為我們的漢語表達的意思更加的豐富,我認為在未來計算機發展的曆程當中,我們漢語的優勢會越來越明顯。”
“另外,計算機是計算機,語言是語言,這英語可以,我們漢語也可以,其它的日語、阿拉伯語等等也都可以,本質上來說任何一種語言都是可以的。”
“隻是我們可能是因為受到了英語的限製,受到了現有編程思維限製,一直無法打破英語編程和英語操作係統留下的條條框框,所以我們一直沒有什麼進展。”
PS:有沒有學計算機的,都出來說說漢語編程的可能性~ .,找書加書可加qq群952868558