【網絡危機●專題】孕育AI要大量數據網民不知不覺變免費勞工

蘋果日報 2019/03/12 01:05

人工智能機器學習網絡危機

AI機器學習要進行大量資料蒐集及人工分類

撰文︰王裕

AI人工智能近年成為各大科技公司投資未來的重押，各方都大量投入資源培養AI，當中主流方式是以機器學習（Machine Learning）向AI程式注入大量參考數據作為學習基礎，時下開始普及的人工智能功能，包括智能助理對談、照片自動因應場合、物件、人物分類，背後是由成千上萬數據累積的成果，情況有如教育嬰孩，要讓嬰孩學曉甚麼是貓，教導者可能要花上重複幾千次的指導方能讓智能確立貓的特徵、行為特質，以最終能確認甚麼是貓；AI機器學習因此要進行大量資料蒐集及人工分類，這背後的一切，就是大量人力和時間。不同的AI功能需要不同學習數據，對話需要創造上百對應例句；照片要每類物品、品種、場景標籤歸類；臉部辨識需要人手糾正輪廓定點等。

Google成功把AI圖片學習應用在用戶登入時的CAPTCHA上，令上億用家免費成為其AI培訓勞工，然而大部份AI學習實在需要大批數據勞工在背後機械性地工作，工作性質近似數據輸入員每天輸入或回應程式問卷。

由於工作性質低微，需要人力資源廣泛，如語言學習或地圖資料等，要在全球張羅當地居民；然而受僱時期只限於軟件開發時期，此外更有防止商業機密洩漏的考慮，絕大部份科技公司都會選擇把數據勞工工作外判，外判公司再以散工形式招聘，勞工薪酬以問卷數量計算，每日可能要在電腦前完成千百計的問卷輸入以維持生計，是備受漠視毫無未來保障的一班「黑工」，亦可能是AI年代來臨前最後一批互聯網基層工作者。

《蘋果動新聞》訂閱新世代，4月開始免費訂閱，現在接受登記！
http://bit.ly/2Ja3IXw
-------------------------
全港打工仔特約：Lun廚動腦Q
加開1:30pm
3月11至22日
星期一至五1:30pm 10:30pm
http://bit.ly/2IZA8Ef

【網絡危機●專題】孕育AI要大量數據 網民不知不覺變免費勞工

【網絡危機●專題】孕育AI要大量數據網民不知不覺變免費勞工