英國《自然》雜志27日公開的論文,報道了一種能在傳統(tǒng)策略游戲——圍棋上擊敗專業(yè)選手的電腦程序。圍棋被認為是人工智能領域一個非常具有標志性的“大挑戰(zhàn)”,這項成果可能會給人工智能領域其他看似難以實現(xiàn)的人類級別能力的項目帶來希望。
現(xiàn)在的國際象棋領域,人類頂尖選手都會被電腦殺得丟盔棄甲,圍棋則不然。圍棋起源于中國,兩個選手在矩形格子上交換下黑子和白子,目標是在比賽結束時比對方占領更多的地盤。正是源于圍棋巨大的搜索空間,很難估計局面和下子,讓圍棋被視作人工智能領域“難以搞定”的標志性項目。迄今最成功的圍棋計算機程序,能達到業(yè)余人類選手的程度,但還不能和專業(yè)選手在不讓子的情況下一較高下。
此次,位于英國倫敦的谷歌旗下DeepMind公司的戴維·西爾弗、艾佳·黃和杰米斯·哈薩比斯與他們的團隊,開發(fā)了一個叫“AlphaGo”的程序,利用“價值網絡”去計算局面,用“策略網絡”去選擇下子。訓練這些深度神經網絡的,是對人類專業(yè)棋局的監(jiān)督學習以及讓它和自己對弈的增強學習。
“AlphaGo”程序在和其他圍棋程序的對抗中獲得了99.8%的勝率,并且在一項競賽中以5比0的成績戰(zhàn)勝了歐洲圍棋冠軍。計算機程序能在不讓子的情況下,在完整的圍棋游戲中擊敗專業(yè)選手,這還是第一次。原本人們認為,要到10年后人工智能才能達到這一成就。