執筆忘字唔駛怕 中大新系統將錯字糾正番
中大錯字別字粵語檢測系統
香港中文大學工程學院研發出首個錯字及粵語檢測系統。系統透過吸收歷屆文憑試試卷及教材內容,幫助香港學生糾正作文時的常犯的錯別字及語病問題。團隊預料系統可於年內推出市場。
負責系統的中大系統工程及工程管理學系教授黃錦輝表示,項目獲香港應用科技研究院支持,開發至今歷時兩年。系統運用了大數據及深度學習等人工智慧技術,令它可如AlphaGo般透過輸入資料讓其自我學習。系統現時輸入了數千份歷屆文憑試經批核的中文試卷、部份報章、及坊間中小學課本和字典作為系統的資料庫。現時系統也在數間學校和補習社進行非公開測試。
項目研究員馮沛璋博士指,檢測系統具備分辨錯別字、粵語用字、倒裝詞及簡體字四大功能,系統對檢測上述錯誤的準確性高達80%,比坊間其他類似的系統準繩度更高。馮亦在記者會上即席示範檢測,當「皇后」和「前后」在同一句字時,系統能分辨出後者的「后」字為簡體字。
但記者實測過程時,發現新系統尚有改善空間,例如系統無法分辨考評局在2015年文憑試考評報告中提出過有學生將「惻隱」寫成「側忍」的錯誤。馮沛璋解釋系統需時間積累知識,相信未來能夠分辨。而系統亦未有提供分辨常見於文憑試的成語誤用、別字功能。黃錦輝指,成語檢測不在他們的研究範圍之內,但未來將會視乎教育界需要而定。
黃錦輝表示,新系統已準備投入使用,他預計年內可將系統「產品化」,團隊未來也會積極考慮將系統拓展至商務範疇上。
項目研究員馮沛璋博士(左)中大系統工程及工程管理學系教授黃錦輝(右)均相信,系統具備人工智能和深度學習能力,系統的檢測功能會日益完善。(朱家駿攝)
檢測系統以句字作單位,每次檢測均只需輸入至少10字,目前尚未能做到單字單詞檢測。(朱家駿攝)
系統未能通過記者出的2015 DSE試題「考驗」,將「側忍」改成「惻隱」,但系統能初步偵測出詞語用字有誤。中大系統工程及工程管理學系教授黃錦輝指,系統只以12至14年DSE試卷作藍本,故尚有改善空間,他強調檢測系統準確度目前已達80%。(朱家駿攝)
項目研究員馮沛璋博士認為,系統不能完全取代老師教學,因為文憑試尚有如「語境」等抽象概念需考核,但他相信系統推出後能協助學生改進中文作文能力。
(朱家駿攝)
中大系統工程及工程管理學系教授黃錦輝表示,現時系統只是初步原型,未來有可能將系統「產品化」,以及開放至網上平台讓公眾使用。(朱家駿攝)