最新帖子

最新回覆

打印

[巴士] AlphaGo後裔AlphaZero創造奇跡,不到24小時訓練擊...

AlphaGo後裔AlphaZero創造奇跡,不到24小時訓練擊...

對於 DeepMind 來說,其最終目的遠非在棋盤遊戲中擊敗人類。他們希望可以打造出壹種通用人工智能,解決更多的人類問題。雖然距離這壹聖杯還很遙遠,但是這周展示的最新研究成果顯示,他們正走在正確的道路上。

在其發表的論文中,最初攻克圍棋的 AI 程序的後代自學了許多其他遊戲,均達到超人水平。經過八個小時地自我練習,擊敗最初戰勝人類圍棋冠軍的 AI 程序,再經過四個小時的訓練後,又擊敗了當前世界國際象棋冠軍程序 Stockfish。更令人驚訝的是,僅經過兩個小時的訓練後,就戰勝了世界最頂尖的日本將棋程序之壹 Elmo。

AlphaZero 代表著 AI 技術壹個非常關鍵的進步,那就是它不是專門為玩這些遊戲而設定的。也就是說,沒有任何人類關於這些遊戲的經驗被輸入進 AlphaZero。在每個案例中,人類只給定 AlphaZero 基本規則,不編程其他策略或戰術。在壹次次自我對弈中,程序玩得更好,步伐不斷加快,這種訓練方式也就是所謂的強化學習。

強化學習技術的應用並不鮮見,今年 10 月亮相的 AlphaGo Zero 就是這壹技術的成果。但是,正如本周發布的這篇論文所說,新版 AlphaZero 是 AlphaGo Zero「更加通用」的版本,這意味著 AlphaZero 能夠被應用在更廣闊的範圍中,且無需事先過多準備。

最贊的地方是,在不到 24 小時裏,同壹個計算機程序就能自學如何玩這三種棋盤遊戲,並超越人類水平。這可謂是 AI 世界的新壯舉。

DeepMind 壹直夢想著能夠建造通用的人工智能,上述任務的成功完成使得 DeepMind 向這壹願景又靠近了壹些,但前方仍舊充滿挑戰。今年早些時候,在 DeepMind CEO Demis Hassabis 展示 AlphaGo Zero 時,他提到,在未來將有壹個能夠解決更大範圍內的科學問題的新版本出現,這壹新版本能夠肩負起從藥物研發到新材料合成等壹系列科研問題。這些問題和遊戲不同,為了找出精確解決它們的方法,仍有大量工作擺在 DeepMind 面前。但我們現在可以肯定的是,人工智能正在前進,AlphaGo 也不僅僅是玩棋類遊戲的 AI 了。

TOP

新宿王子大飯店

優惠價:HK$998

原價:1,050

東京新宿華盛頓酒店

優惠價:HK$768

原價:1,018

新宿新城市酒店

優惠價:HK$778

原價:972

HUNDRED STAY Tokyo Shinjuku

優惠價:HK$861

原價:1,013

重要聲明:本網站討論區內容是以即時上載留言的方式運作,Qoos.com 對所有留言的真實性、完整性及立場等,不負任何法律責任。一切留言之言論只代表留言者個人意見,並非本網站之立場,用戶不應信賴內容,應自行判斷內容之真實性。由於本討論區受到「即時上載留言」運作方式所規限,故不能完全監察所有留言,若讀者發現有留言出現問題,請聯絡我們。Qoos.com 有權刪除任何留言及拒絕任何人士上載留言,同時亦有不刪除留言的權利。切勿撰寫粗言穢語、誹謗、渲染色情暴力或人身攻擊的內容,敬請自律。