據(jù)悉AlphaGo人工智能是由DeepMind開發(fā)的,目的是征服世界上最古老的游戲:圍棋。圍棋是一種非常受歡迎的游戲,而且它比國際象棋更復雜。還有什么比圍棋更好的游戲來測試這款人工智能呢?
通過從與不同水平的玩家的數(shù)千盤圍棋博弈中學習,AlphaGo已經(jīng)學會了玩這個游戲。它最終擊敗了圍棋冠軍Lee Sedol,他是一位18個世界圍棋冠軍獲得者。AlphaGo人工智能的后一個版本,AlphaGo Zero(AGZ),甚至學會了通過玩游戲來不斷挑戰(zhàn)完善自己。AGZ能夠贏得一場對抗AlphaGo的圍棋比賽,所以我們可以說他是世界上最好的圍棋選手。
令人印象深刻的是,AGZ能夠在沒有研究人員的幫助或投入的條件下完全依靠自己的能力達到專業(yè)棋手水平。該團隊認為,通過跳過人類輸入階段可以擁有優(yōu)勢:“人類的知識可能對于解決一些問題來說太昂貴、太不可靠或根本無法使用。”然而,真正令人震驚的是,AGZ人工智能在發(fā)展自己的技能方面可以走得更遠。
DeepMind的首席執(zhí)行官兼聯(lián)合創(chuàng)始人Demis Hassabis在谷歌的Go North大會上說,關于AGZ,“我們從來沒有真正探索出這個版本的AlphaGo的能力能到達多高的一個高度。我們需要電腦來做別的事情。”
AGZ可以進行重新啟動,這可以幫助人類圍棋玩家學習新的落子方式和策略。人工智能也可以被重新指派到解決其他的問題。研究人員說,這些任務可能包括很多類別,比如:蛋白質(zhì)折疊問題,如何減少能量消耗,或者尋找革命性的新材料。AGZ有潛力創(chuàng)造一個更美好的社會,而開發(fā)團隊也在進一步探索它。
不過,也有業(yè)內(nèi)人士指出,“拋棄人類經(jīng)驗”和“自我訓練”并非AlphaGo Zero最大的亮點,其關鍵在于采用了新的reinforcement learning(強化學習的算法),并給該算法帶了新的發(fā)展。那么,小伙伴們又如何看待此事呢?
留言與評論(共有 條評論) |