【名家搶先睇】延禧攻略與人工低能(方興)
方興AI名家搶先睇
人工智能成功挑戰圍棋後,電腦遊戲成為下一個要攻佔的陣地,上月底便再有一場人機大戰上演,戰場是廣受歡迎的網絡電腦遊戲Dota2,結果AI玩家連輸兩局敗北,但觀乎近年AI的發展,電玩被攻陷可能只是時間問題,所以有科學家近日開始研究人工低能(Artificial Stupidity),對,你無聽錯,這是要在AI完全超越人類前,裝定保險絲。
近日大熱的宮鬥劇「延禧攻略」,每集均描寫主角如何應付危機及打大佬,過關斬將升呢。人生如打機,故此電腦遊戲從來都是AI的修練場地,在虛擬中提煉現實中有用的原則。早幾年AlphaGo的前身,便是從第一代電視遊戲雅達利(Atari)上取得突破,雖然AI已可自學撞磗(Breakout)這類簡單遊戲,但現時流行的新款遊戲,自由度極大,版圖又開放,複雜程度不可同日而語。好像Dota2,便是由兩隊各5名角色在一個巨大版圖上對疊,每種角色均有不同技能,能率先摧毀敵方基地者勝。
今次向人類玩家挑戰的,是近來新聞多多的Tesla創辦人Elon Musk投資的研究機構OpenAI,其派出的AI機械人與兩隊專業高手決戰。 OpenAI用的技術是強化學習(reinforcement learning),即不向AI輸入遊戲規則,任由其自行摸索試錯,AI只得知在殺敵或贏得賽事後會有獎勵。
為訓練5個機械人的智能,OpenAI的訓練系統使用了256個圖型處理器(GPU)及12.8萬個CPU核心,要起動及協調這麼大型的一個系統,本身已相當複雜,其目的是達致訓練AI一天,便相當於人類180年的功力。
正如AlphaGo開創了一些前所未見的圍棋走法一樣,OpenAI訓練的角色,亦出現一些新策略新走法,兼且各個角色的相互組織及動作非常精確俐落,對人類玩家亦有啟發之處。
AI今次究竟輸在那裡呢?原來是太短視,缺乏長遠策略,而且優勢一被拋離,便容易兵敗如山倒。雖然AI已具備較長記憶力,但要它懂得以退為進、輸粒糖贏間廠等大道理,殊不容易。
要突破這樽頸,有科學家嘗試為AI引入好奇心,在程式內置一套獎賞系統,讓AI自行摸索、觀察世界,希望以此令AI孕育出更長線的攻略。
AI越來越踩過界,6月中IBM的AI與人類辯論打平手,兩個月後OpenAI便衝擊電競,難怪有科學家開始提出「人工低能」的概念,即透過限制硬件裝置,或將人類的一些認知缺失編入程式碼,以防止AI由只是精通個別工作進化至通才的超級智能時,會倒過來反控人類。
這一天或許不會很快來到,但我更擔心的,是如以色列歷史學者尤瓦利.赫拉利在新書中所言,過去兩百年大家總相信市場比集權更有效率,這說法將被強調規模強調集中化的AI及大數據所扭轉,當集權因新科技之助,倒過來比市場更有效率時,自由便將悄悄遠去。
全球樓行 Dream House零距離
https://hk.feature.appledaily.com/overseasproperty