第403章寫個搜索引擎玩玩
這年頭搜索引擎對於很多人來說還比較神秘,但在二十年後已經是公開的技術了,整個流程和各種page rank算法都是在網上就能下載到的,關於搜索引擎核心技術的詳解,國內外各種書籍出了一本又一本,胡一亭自己就曾經在百無聊賴時分析過多個算法,還曾經想過拉點投資搞個搜索引擎,從IC設計全棧工程師的繁重研發業務下脫身,自己當個小老板,因此對此毫不陌生,完全可以閉著眼睛抄一個出來,在此基礎上由技術人員不斷更新加強,要抄的話,無論如何,那些都是領先這個時代十幾年的算法,拿出手就能立刻秒殺雅虎,把穀歌掐死在繈褓裡。
胡一亭見大家都欽佩地看著自己,還以為他們不信卻又不好意思說出口,隻得笑道:“這真不是什麼難事,搜索引擎說白了就三步,第一步下載,把要分析的網頁抓下來。第二部是索引,這裡麵主要是先要寫個全文檢索引擎,對第一部裡麵下載下來的文本內容進行預處理,進行智能的分詞,然後進行數據清洗,把非關鍵詞和無效內容刨掉,隻保留重要部分,搜索的時候其實就是搜索索引,根據用戶查詢的關鍵詞,在索引裡尋找匹配內容,然後展示出來。雅虎就是手工索引,其實本質上就暴露出他們的算法有大問題,圖樣圖森破,幼稚的很。
第三點是真正有點難度的,就是說在匹配內容過多時,怎麼排序,怎麼把最符合用戶搜索目的的內容排在前麵,這就有一個排序的算法問題,這裡麵牽涉到一個打分製度,排序算法要把把高分項目排在前麵,這裡麵牽涉到網站的重要程度和網頁的時效性。
但總的來說,讓我來寫的話,一個禮拜就能拿出產品上線運行。
真的,這真不是什麼高深的技術。”
胡一亭解釋了一番,可大家哪裡對他有什麼懷疑,聞言更覺他簡直就是技術之神!
參加會議的技術人員都激動不已,覺得胡總真是太牛了!牛大發了!把這樣前沿的技術說的跟大白菜似的,這得有多大的底氣呀!全國大概再也找不出像胡總這樣的第二個人了吧!真不愧是中國數學界的新寵!中國IC業的天才領軍人物!中科院計算所的驕傲!國產處理器的希望!全球首款通訊軟件的締造者!重光集團之首!自主研發信仰的守護者!
重光軟件幾名技術主管紛紛表態,“胡總你能不能讓我參加這個項目,帶帶我,我一直都想知道怎麼寫搜索算法。”
“胡總你帶上我吧!彆說一個禮拜,一年都行!這樣的前沿的搜索引擎技術,一年能寫出來都是超高水平的了!”
“胡總我也想參加這個項目,我幫您抓BUG,這我內行。”
這些技術人員裡,王保良更是知道胡一亭輕描淡寫幾句話其中的難度,激動之餘心馳神往道:“胡總你真是舉重若輕!這麼難的前沿技術,可是聽你說起來卻簡直像是閒庭信步,你真是奇才!不愧是我們國家超一流的數學家!我早該知道的,你連龐加萊猜想都能解開,處理器多媒體指令集都能單槍匹馬的編出來,寫個算法那還不是玩兒似的,這種東西在你眼裡肯定是跟小孩子過家家一樣輕鬆。”
王麗麗也為胡一亭驕傲,自豪道:“這是自然的,我就沒見過有胡總解決不了的技術難題,在研發上,胡總那是真功夫,真正的天才。”
胡一亭笑著擺手:“你們不用誇我,我知道自己幾斤幾兩,能做的我當然會做,這樣吧,接下來我儘快把算法寫出來,爭取早日把咱們重光的搜索引擎推上線,接受用戶的檢驗。”
會議結束後,胡一亭已經擬定了項目組名單,因為有足夠的把握在很快時間裡寫完或者叫抄完算法,胡一亭一口氣叫上了王保良等五名軟件工程師,六人一起進行搜索引擎核心算法的編寫。
接下來一周裡,胡一亭每天上午天不亮就起床,和王保良等人在重光軟件小小的會議室中進行算法編寫,算是臨時征用了這間屋子。
編寫過程中王保良等人著實領教了什麼叫做天才。
繼頭一天胡一亭簡單編寫了一部軟件開發計劃書之後,接下來幾日就見他在電腦前頭也不抬的寫代碼,一套完全不用修改的先進算法如清溪般從他指尖流淌出來。