【網絡危機●專題】孕育AI要大量數據 網民不知不覺變免費勞工
人工智能機器學習網絡危機
AI人工智能近年成為各大科技公司投資未來的重押,各方都大量投入資源培養AI,當中主流方式是以機器學習(Machine Learning)向AI程式注入大量參考數據作為學習基礎,時下開始普及的人工智能功能,包括智能助理對談、照片自動因應場合、物件、人物分類,背後是由成千上萬數據累積的成果,情況有如教育嬰孩,要讓嬰孩學曉甚麼是貓,教導者可能要花上重複幾千次的指導方能讓智能確立貓的特徵、行為特質,以最終能確認甚麼是貓;AI機器學習因此要進行大量資料蒐集及人工分類,這背後的一切,就是大量人力和時間。不同的AI功能需要不同學習數據,對話需要創造上百對應例句;照片要每類物品、品種、場景標籤歸類;臉部辨識需要人手糾正輪廓定點等。
Google成功把AI圖片學習應用在用戶登入時的CAPTCHA上,令上億用家免費成為其AI培訓勞工,然而大部份AI學習實在需要大批數據勞工在背後機械性地工作,工作性質近似數據輸入員每天輸入或回應程式問卷。
由於工作性質低微,需要人力資源廣泛,如語言學習或地圖資料等,要在全球張羅當地居民;然而受僱時期只限於軟件開發時期,此外更有防止商業機密洩漏的考慮,絕大部份科技公司都會選擇把數據勞工工作外判,外判公司再以散工形式招聘,勞工薪酬以問卷數量計算,每日可能要在電腦前完成千百計的問卷輸入以維持生計,是備受漠視毫無未來保障的一班「黑工」,亦可能是AI年代來臨前最後一批互聯網基層工作者。
《蘋果動新聞》訂閱新世代,4月開始免費訂閱,現在接受登記!
http://bit.ly/2Ja3IXw
-------------------------
全港打工仔特約:Lun廚動腦Q
加開1:30pm
3月11至22日
星期一至五1:30pm 10:30pm
http://bit.ly/2IZA8Ef