【棋王輸了】 國產「星陣」擊敗28高手 參考AlphaGo技術而生

蘋果日報 2018/04/27 09:11

圍棋柯潔大戰AI人工智能

中國圍棋第一人柯潔今日將與國產AI星陣(Golaxy)對戰,這是柯潔自11個月前,0-3不敵AlphaGo之後,再次於公開比賽中大戰圍棋AI。柯潔是世界圍棋九段棋手,而星陣前身是清華大學神算子,由小川教授領銜的星陣圍棋公司開發的圍棋人工智能,截至前日晚,星陣先後與30位職業棋手網戰,星陣戰績為28勝2負。
許多人都好奇「星陣」與曾擊敗柯潔的「AlphaGo」兩者的分別,對於「星陣」這個國產AI系統,開發團隊僅透露系統兩個特點:第一,星陣參考了AlphaGo論文的技術,並在模型結構、蒙地卡羅樹搜尋(Monte Carlo tree search;簡稱:MCTS)算法上都有一定的突破;第二,這是中國的人工智能團隊智慧結晶。
有研究過AlphaGo最極版本的「AlphaGo Zero」論文的人都知道,真正讓AlphaGoZero飛躍提升,擊敗人類頂尖圍棋高手的關鍵在於「強化學習」技術。然而,為打造AlphaGoZero,Google團隊投入了大量計算力。四十天強化學習僅租用硬件成本就耗資近億元人民幣。星陣團隊透露,他們正在積極探索利用少量資源達成同樣水平的新算法。
星陣團隊並未使用強化學習的方式來提高,而是在技術上另辟蹊徑,至於使用了何種方式及其體水平,團隊並未透露,只是表示期待與柯潔能夠下出更加動人心魄的棋譜。
「星陣」此前並未正式亮相,星陣其實是圍棋的別稱之一。圍棋棋盤有361個交叉點,中心點「天元」象徵著混元一周天的度數,棋盤上的九個星標座與易理八卦相通,整個棋局用黑白兩種符號組合排列,隱含太極陰陽。每顆棋子著在棋盤上,象徵星星在周天排列陣勢,借喻指圍棋。
綜合報道