第157章 橘子大模型(第二更)(1 / 2)

第160章?橘子大模型(第二更)

做一個人工智能,不是方豫給柚子吩咐一下就可以的。

可能是出於安全方麵的考慮,塞卡利斯在創造柚子的時候,並沒有給這個球添加自主創新意識。

隻有柚子的所有人對它下達明確的指令,他才會就指令進行下一步的信息收集與演算。

對於一個係統性的任務,柚子需要主人給他把係統性任務分解成為一個個獨立而明確的任務。

如果方豫隻是告訴它:柚子,做一個通用型人工智能出來。

它會完全不知所措,也無從著手,它不會去主動分析這個任務需要什麼樣的前置知識,也不會創造性的去執行這個任務。

這樣一來,就需要方豫自己先對人工智能大模型有相當的了解才可以。

給柚子指明一個方向,分解任務,柚子執行。

如果執行成功,那就是搞成了,如果不成功,說明方豫對人工智能的理解有問題,方向不對,就需要換方向。

歸根究底,柚子這麼懶也是有原因的!

“現在,把我剛才說的方案做一個初步推演,然後把推演結果告訴我。”方豫一邊給柚子下指令,一邊劈裡啪啦的在電腦上改總結。

柚子寫的階段總結太超前了,方豫得刪除一部分,還得改錯一部分,再交給童永山。

現在方豫已經在童永山心目中建立起了計科高手的印象,索性一階段童永山就沒再找任何計科專業的大佬合作,而是直接和柚子科技達成的合作研究意向。

至於說柚子科技是誰的,童永山更不在乎。

就算這家公司就是自己這個學生的又能怎樣?有一個肯投幾千萬在科研上的二代學生不香嗎?

要是被其他教授知道,早就嫉妒壞了吧?

“主人,Res與DBN的結合對處理長距離依賴關係的能力應不會有任何提高,我們需要更換模型組合。”經過短時間的運算,柚子閃著銀白色的星光回答道。

“那就替換一下,看看哪些模型之間能擦出火花來。”方豫在服務器上圈定了模型範圍,交給柚子進行演算。

模糊演算是柚子本身所具備的法則之一,本質其實是預言學派的一些基礎理論在柚子身上的應用。

與計算機模型中提取關鍵因子進行模糊演算的方式完全不同,相比起來,柚子的模糊演算準確性要高得多。

“找到了!”沒過多久,柚子就發出了振奮的聲音。

“《帶注意力的序列到序列》中提到的注意力機製模型與位置編碼技術和LSTM、、FFN等神經網絡的結合,可以形成新的框架,經過訓練後添加其他模型,可以形成目前測算中效率最高的大模型。”柚子迅速在方豫的電腦屏幕上投出了相應內容。

“我會把這些模型放到我自己的框架內,由我的框架進行重組。”…。。

說著,柚子身上的銀色星光逐漸變成了一條緩慢流轉的光帶,這是柚子在用自己的本體幫助陣列服務器進行輔助運算,再把輔助運算的結果傳輸至服務器網絡。

隻要找對了路,柚子的運算能力遠非現如今任何一台超級計算機所能相提並論的。

不過三分鐘,身上流淌的銀色光帶便重新變回了點點銀色星光。

“框架重組完成,底層法則添加完畢,上傳服務器係統後進行初次學習。”柚子平鋪直敘的聲音傳來,似乎變了一個球,跟電影裡的人工智能一樣。

方豫不為所動搓了搓手指:“好好說話!”

柚子明顯一激靈,語氣諂媚:“主人,大概還要30秒,新的框架就能上傳至服務器,其後就可以做模型數據訓練了。”

話說著,體積並不大的框架模型已經完整上傳至服務器機組,服務器內的柚子分身就開始往新框架中添加處理過的數據。

12組GPU服務器、196顆TesM60算力全開,服務器的散熱風扇以一萬五千轉的速度旋轉著,將熱量排至這不足五十平米的空間中。

“目前已完成40GB的數據清洗,現在開始用這部分數據進行第一次訓練,這個模型需要30萬步的迭代可以完成收斂,預計將耗時3小時21分。”

隨後,方豫的屏幕上出現了一個3小時21分20秒的倒計時。?方豫搓了搓手,在屋子裡走了兩圈,心情既期待又激動。

如果這個模型經過數據訓練,能夠表現出一定的分析處理能力和交流能力,就意味著,自己真的搞出了一個可用的人工智能大模型!

上一章 書頁/目錄 下一頁