“我可以為大家爭取,”麥克林說道:“但是目前來說,大家最好還是按照D日來進行工作計劃。”
“國傑教授那邊呢?”周至對麥明川問道。
李國傑是負責曙光超算操作係統SNIX的,他們那邊也有大字庫的需要,因此也有一套班子,主要負責對這邊的成果進行驗證,其實主要就是白嫖。
但是蜀大也沒有辦法,因為為了提高工作效率,周至之前開發了一套文字識彆係統,這個係統能夠通過一係列的處理,將掃描的圖像字轉化為係統使用的矢量字,毫無疑問能夠節約大量的人工勞動。
但是有個問題,就是非常消耗運算資源,蜀大的幾台機子處理不了,這部分工作得交給曙光超級計算機來完成。
雖然部委和超算中心頗有以大欺小的嫌疑,畢竟設計思路和解決方案都是蜀大提出來的,超算中心隻負責運算出成果而已,然而拋開這些不談的話,這其實不亞於阿姆斯特朗登錄月球的一步。
文科863工程項目也有了使用超級計算機的資格,周至這也算是給文理之間身後的隔閡撕開了一條縫隙。
“曙光很厲害。”說到這個麥明川也不得不服:“雖然分給我們的工作時間很少,但是采字工作已經全部完成了,就目前我們收集的七萬多個漢字,已經全部完成了矢量化的工作。”
“不過配碼工作老李不肯幫忙了,得咱們自己來水磨。”
“這個好辦。”辜開來說道:“肘子根據我編字典的方法編寫了一套計算機算法,能夠將《漢語大字典》裡的漢字,按照當時的編目規則,將文字自動轉化成編碼。”
“是嗎?要有這個可就太方便了!”麥明川大喜:“我跟學校建議過對肘子進行特招,你們就是推擋。要乾字庫,正需要文理兼通的人才才行!”
“隻是這套規則隻處理了《漢語大字典》裡的五萬字。”周至說道:“而瀚文大字庫一二級就是七萬字,三級加上更是過十萬了,還是需要結合識彆係統裡的字根與筆畫識彆功能,配合文字的讀音和筆畫,給矢量字配碼才行。”
“給《漢語大字典》完成編碼,用了多少時間?”
“在矢量字現成的情況下,采集字根,參考讀音,分配編碼。”周至笑道:“其實動作很快的,反倒是調試BUG和處理一些係統無法判定的存疑字,耗費的時間更多。”
“我用了兩天時間完成了可行性實驗,在個人電腦上能夠做到五秒處理一個字。”
“那就省大事兒了!”王主任又驚又喜:“如此一來我們D日前按時交付產品,應該就沒有問題了。”
麥明川現在覺得周至簡直就是瀚文大字庫工程的吉祥物,他一來工程就能夠取得巨大的進展,這娃非常喜歡動腦筋,喜歡開發各種各樣的程序來代替繁瑣工作,從最早的手寫字庫,到字根筆畫分析係統,識彆係統,轉換係統,再到現在的自動編碼係統,常常使用蠻不講理的方式,給理科生們撞開一條條寶貴的道路。
李紅江團隊下的人的確有些委屈,他們現在也漸漸明白了這個工程的本質,那就是它本身的確是一個文科項目,設計思路、理念、方法論,全都是文科的那一套,具體到了操作層麵,才有理科生插手的餘地。
說白了,這就叫管理層和打工仔的區彆。