【名家搶先睇】延禧攻略與人工低能（方興）

蘋果日報 2018/09/05 12:01

方興AI名家搶先睇

OpenAI進行Dota2遊戲。

人工智能成功挑戰圍棋後，電腦遊戲成為下一個要攻佔的陣地，上月底便再有一場人機大戰上演，戰場是廣受歡迎的網絡電腦遊戲Dota2，結果AI玩家連輸兩局敗北，但觀乎近年AI的發展，電玩被攻陷可能只是時間問題，所以有科學家近日開始研究人工低能（Artificial Stupidity），對，你無聽錯，這是要在AI完全超越人類前，裝定保險絲。

近日大熱的宮鬥劇「延禧攻略」，每集均描寫主角如何應付危機及打大佬，過關斬將升呢。人生如打機，故此電腦遊戲從來都是AI的修練場地，在虛擬中提煉現實中有用的原則。早幾年AlphaGo的前身，便是從第一代電視遊戲雅達利（Atari）上取得突破，雖然AI已可自學撞磗(Breakout)這類簡單遊戲，但現時流行的新款遊戲，自由度極大，版圖又開放，複雜程度不可同日而語。好像Dota2，便是由兩隊各5名角色在一個巨大版圖上對疊，每種角色均有不同技能，能率先摧毀敵方基地者勝。

今次向人類玩家挑戰的，是近來新聞多多的Tesla創辦人Elon Musk投資的研究機構OpenAI，其派出的AI機械人與兩隊專業高手決戰。 OpenAI用的技術是強化學習（reinforcement learning），即不向AI輸入遊戲規則，任由其自行摸索試錯，AI只得知在殺敵或贏得賽事後會有獎勵。

AI練一日相當人類180年功力

為訓練5個機械人的智能，OpenAI的訓練系統使用了256個圖型處理器（GPU）及12.8萬個CPU核心，要起動及協調這麼大型的一個系統，本身已相當複雜，其目的是達致訓練AI一天，便相當於人類180年的功力。

正如AlphaGo開創了一些前所未見的圍棋走法一樣，OpenAI訓練的角色，亦出現一些新策略新走法，兼且各個角色的相互組織及動作非常精確俐落，對人類玩家亦有啟發之處。

AI今次究竟輸在那裡呢？原來是太短視，缺乏長遠策略，而且優勢一被拋離，便容易兵敗如山倒。雖然AI已具備較長記憶力，但要它懂得以退為進、輸粒糖贏間廠等大道理，殊不容易。

要突破這樽頸，有科學家嘗試為AI引入好奇心，在程式內置一套獎賞系統，讓AI自行摸索、觀察世界，希望以此令AI孕育出更長線的攻略。

AI越來越踩過界，6月中IBM的AI與人類辯論打平手，兩個月後OpenAI便衝擊電競，難怪有科學家開始提出「人工低能」的概念，即透過限制硬件裝置，或將人類的一些認知缺失編入程式碼，以防止AI由只是精通個別工作進化至通才的超級智能時，會倒過來反控人類。

這一天或許不會很快來到，但我更擔心的，是如以色列歷史學者尤瓦利．赫拉利在新書中所言，過去兩百年大家總相信市場比集權更有效率，這說法將被強調規模強調集中化的AI及大數據所扭轉，當集權因新科技之助，倒過來比市場更有效率時，自由便將悄悄遠去。

方興

全球樓行 Dream House零距離
https://hk.feature.appledaily.com/overseasproperty