第640章 貪心並非全局最優解(2 / 2)

“你聽說過‘貪心算法’嗎?”

“這種‘貪心’策略的特點就是每次遇到一個新情況的時候,都從當前的角度出發,選擇目前看來最好的選項。”李默然繼續解釋道,“就比如你在玩遊戲的時候,每個關卡結束後都會爆出寶箱,你需要從大量的道具當中選擇一個,而使用‘貪心’策略的玩家會始終選擇目前自己最需要,或者所目前看來收益最大的道具。”

“在有些時候,這樣的策略的確是可以得到不錯的結果,但它並不是能適合一切情況。”

“一個簡單的例子,比如在前麵的關卡中會有一個非常沒用的道具,它在前幾關幾乎不能給玩家帶來任何收益,然而如果玩家沒有這個道具,就會導致後期的關卡過不去……”

“這個時候,‘貪心’策略就失效了,因為每次都選擇局部最優解,並不能在最後得到全局最優解!”

丁願翔似乎明白了李默然的意思:“你是說,這個人工智能的策略其實是不完美的,戰爭在幾年內或者幾十年內對於帝國來說是收益最大的選項,但如果放到更長遠的尺度……”

李默然點了點頭:“這也和‘囚徒困境’很像,參與博弈的人每個人都貪心地去選擇對自己最有利的方案的話,反而會導致整體結果都變差,形成‘雙輸’的局麵。”

李默然看了一眼核心:“或許有什麼辦法可以修改這個人工智能的策略……讓它的策略更加合理。”

但有一個問題擺在了李默然的麵前,他應該怎麼去修改這個人工智能的策略邏輯?這終究是一台冷冰冰的機器,它沒有人類的感情,也不知道‘靈活變通’,隻會按照預定的算法規則絕對理性地運行。

將‘貪心策略’改為以一萬年之後的結果為目標的‘深度優先搜索’?還是修改成動態規劃算法,讓這台算力接近無窮無儘的計算機去尋找那個全局最優解?

但無論李默然如何設置,冰冷的機器始終是冰冷的機器,即使是采用“動態規劃”之類的算法,他也必須給對方提供價值函數或者目標,也就是告訴這台人工智能它要追求的最終目的是什麼,他要去求什麼的‘最大值’。

可這樣的方法始終都會有漏洞的,就像新王給這台機器設置的目標是“帝國利益最大化”一樣,在漫長的歲月中,指不定會出現什麼問題。

他想起了以前看過的一部科幻電影,裡麵人類給人工智能設定的目標是“讓地球更美好”,結果人工智能推算出來得到的策略是把人類全部乾掉地球就美好了。甚至有公司會給人工智能設置“製造更多的馬桶搋子”這樣的生產目標,但人工智能執行到後麵為了追求生產的最大化,就開始發動戰爭,侵略整個星係,然後用掠奪來的資源全部造馬桶搋子。

聽上去很離譜,但對於死板的機器就是會發生這樣的事情的,即使李默然拚儘全力像一個律師一樣把條款編得看上去滴水不漏,最後也會出問題出bUG。

龐大而複雜的機械係統,隨著熵增,完全不出bUG的可能性幾乎為零。新王真是給他出了個難題。

就在李默然苦思冥想之際,幾個關鍵信息在他的腦海中交融,讓他聯想到了其他的事情。

死板的規則、靈活維持公平……

“這不是……和天道的情況一樣嗎……”李默然恍然大悟。

上一頁 書頁/目錄 下一章