要防止上述情況發生,DeepMind 和人類未來研究所研究人員就提出以建立一套演算法防止人工智能學習到干擾紅色按鈕運作,同時制止 AI 行為。他們指運算法可以容許操作員在正常方法未能操控 AI 時,發出特別指令來停止 AI 的活動。他們並不會知道相關指令是源自人類,而是誤以為是自己主動停止運作——即他們不會抗拒這個指令。他們也提議,一方面要加強這種「欺騙 」AI 的機制成功中斷運作的機率,另一方面在未來也可考慮增加定時中斷機制,讓 AI 在指定時間停止運作。
報告:
Orseau, L. & Armstrong, S. (2016). Safely Interruptible Agents. Machine Intelligence Research Institute, Published Online.