第160章?橘子大模型(第二更)
做一個人工智能,不是方豫給柚子吩咐一下就可以的。
可能是出於安全方麵的考慮,塞卡利斯在創造柚子的時候,並沒有給這個球添加自主創新意識。
隻有柚子的所有人對它下達明確的指令,他才會就指令進行下一步的信息收集與演算。
對於一個係統性的任務,柚子需要主人給他把係統性任務分解成為一個個獨立而明確的任務。
如果方豫隻是告訴它:柚子,做一個通用型人工智能出來。
它會完全不知所措,也無從著手,它不會去主動分析這個任務需要什麼樣的前置知識,也不會創造性的去執行這個任務。
這樣一來,就需要方豫自己先對人工智能大模型有相當的了解才可以。
給柚子指明一個方向,分解任務,柚子執行。
如果執行成功,那就是搞成了,如果不成功,說明方豫對人工智能的理解有問題,方向不對,就需要換方向。
歸根究底,柚子這麼懶也是有原因的!
“現在,把我剛才說的方案做一個初步推演,然後把推演結果告訴我。”方豫一邊給柚子下指令,一邊劈裡啪啦的在電腦上改總結。
柚子寫的階段總結太超前了,方豫得刪除一部分,還得改錯一部分,再交給童永山。
現在方豫已經在童永山心目中建立起了計科高手的印象,索性一階段童永山就沒再找任何計科專業的大佬合作,而是直接和柚子科技達成的合作研究意向。
至於說柚子科技是誰的,童永山更不在乎。
就算這家公司就是自己這個學生的又能怎樣?有一個肯投幾千萬在科研上的二代學生不香嗎?
要是被其他教授知道,早就嫉妒壞了吧?
“主人,Res與DBN的結合對處理長距離依賴關係的能力應不會有任何提高,我們需要更換模型組合。”經過短時間的運算,柚子閃著銀白色的星光回答道。
“那就替換一下,看看哪些模型之間能擦出火花來。”方豫在服務器上圈定了模型範圍,交給柚子進行演算。
模糊演算是柚子本身所具備的法則之一,本質其實是預言學派的一些基礎理論在柚子身上的應用。
與計算機模型中提取關鍵因子進行模糊演算的方式完全不同,相比起來,柚子的模糊演算準確性要高得多。
“找到了!”沒過多久,柚子就發出了振奮的聲音。
“《帶注意力的序列到序列》中提到的注意力機製模型與位置編碼技術和LSTM、、FFN等神經網絡的結合,可以形成新的框架,經過訓練後添加其他模型,可以形成目前測算中效率最高的大模型。”柚子迅速在方豫的電腦屏幕上投出了相應內容。
“我會把這些模型放到我自己的框架內,由我的框架進行重組。”…。。
說著,柚子身上的銀色星光逐漸變成了一條緩慢流轉的光帶,這是柚子在用自己的本體幫助陣列服務器進行輔助運算,再把輔助運算的結果傳輸至服務器網絡。
隻要找對了路,柚子的運算能力遠非現如今任何一台超級計算機所能相提並論的。
不過三分鐘,身上流淌的銀色光帶便重新變回了點點銀色星光。
“框架重組完成,底層法則添加完畢,上傳服務器係統後進行初次學習。”柚子平鋪直敘的聲音傳來,似乎變了一個球,跟電影裡的人工智能一樣。
方豫不為所動搓了搓手指:“好好說話!”
柚子明顯一激靈,語氣諂媚:“主人,大概還要30秒,新的框架就能上傳至服務器,其後就可以做模型數據訓練了。”
話說著,體積並不大的框架模型已經完整上傳至服務器機組,服務器內的柚子分身就開始往新框架中添加處理過的數據。
12組GPU服務器、196顆TesM60算力全開,服務器的散熱風扇以一萬五千轉的速度旋轉著,將熱量排至這不足五十平米的空間中。
“目前已完成40GB的數據清洗,現在開始用這部分數據進行第一次訓練,這個模型需要30萬步的迭代可以完成收斂,預計將耗時3小時21分。”
隨後,方豫的屏幕上出現了一個3小時21分20秒的倒計時。?方豫搓了搓手,在屋子裡走了兩圈,心情既期待又激動。
如果這個模型經過數據訓練,能夠表現出一定的分析處理能力和交流能力,就意味著,自己真的搞出了一個可用的人工智能大模型!