貝索斯的技術員編寫的是一種純自動化的爬蟲腳本。
在互聯網時代,一切講究的是效率和速度,但是有時候,單純的效率會催生出巨大的隱患。
任何網站的負載都是有限的,如果一個網站的登陸訪問請求超過某個上限值,比如一秒鐘幾萬次的登陸請求,那麼整個網站都會宕機,數據量再加大的話,服務器甚至有可能燒。
而黑客最常用的攻擊方式,就是寫一個自動化的登陸腳本去不斷的請求登陸。
為了防黑客,一些程序員大佬發明了一種驗證人機的辦法——驗證碼!
沒錯,大家最討厭的驗證碼,其實是為了防黑客的!
因為驗證碼是動態變化的,每一次都不一樣,黑客編寫的純自動化腳本沒辦法識彆。
貝索斯的技術團隊開發的這種純自動化爬蟲腳本,就類似於黑客的那種腳本。
它可以做到一秒鐘采集10萬次數據!
而掏寶的服務器是能夠承載千萬人同時在線流量的“怪物”,這點數據采集數量,根本不會引起掏寶的懷疑。
1秒鐘10萬次,貝索斯甚至可以在半小時內把淘寶網的所有頁麵數據全部采集完!
到了淩晨12點的時候。
喬恩興奮的找到眼圈發黑的貝索斯,激動的道:“boss,我們的爬蟲已經開始爬數據了,爬完數據後,技術團隊會把數據上傳到咱們自己的數據庫!”
“嘿嘿,陳默肯定不知道,掏寶斥巨資辛辛苦苦搞的數千萬的賣家頁麵數據,咱們爬蟲爬了半個小時就能爬完。這給咱們省了一大筆錢呢!”
貝索斯立刻起身,開心道:“nice!告訴技術團隊,這件事搞定以後,我給他們發獎金!”
頓了頓,貝索斯又道:“對了,ip一定要勤換著點,在爬完數據之前,千萬彆被對方的程序大牛給逮到!”
喬恩立刻點了點頭:“好!我這就去吩咐!”
自動更換ip功能很好做,甚至有現成的軟件,不需要技術員現場編寫,直接下載一個拿過來用就是了。
12點5分,貝索斯的爬蟲正式出動對掏寶的頁麵數據進行大量的采集。
此刻,馬福報正在掏寶親自坐鎮加班。
雖然反作弊功能和水印logo功能都可以自動開啟。
但是為了能竊取樂掏一部分流量,馬福報讓技術員暫時關閉了這倆功能,聽從他的指揮。
隻要馬福報一聲令下,這兩個功能就能瞬間開啟,把所有被爬蟲爬走的數據變成臟數據!
當樂掏的爬蟲開始肆無忌憚的采集掏寶數據時,掏寶的技術員早就發現了異常!
“馬總,對方行動了!而且爬蟲的速度非常快,不用半小時就能爬走咱們全部的數據!”
技術總監說道。
“聽我命令,反作弊功能開啟!”
馬福報朗聲道。
“是!”
技術總監立刻敲下了一行命令,反作弊功能開啟,一瞬間,把所有掏寶的頁麵數據變成了臟數據。
半小時後。
喬恩興奮的彙報:“boss,所有數據已經爬完上傳到咱們樂掏了!”
“不光是答應跟咱們合作的掏寶賣家的店能全部在樂掏複製了,其他所有的掏寶賣家,隻要他們想,也能一鍵在咱這邊開店,沒有任何成本!”
貝索斯雙眼發亮:“好!非常好!”
“告訴那些答應來咱們這開店的掏寶店主,今晚我們就開始搞,就趁著陳默睡覺給他來個出其不意!”
“另外,馬上去通知那些流量網站給咱們的樂掏店倒流,現在就支付尾款!快去!”xiaoshubao.net
“是!”
喬恩也明白,時不我待。