當中不乏股份的主席報告出現字眼突變,如長和2015年度的年報,便較2014年度差了一截,引用上述研究提供的情緒字眼分析★,長和該年度的主席報告英文版的正面用語,由對上一年的3.5%下降至2.1%,而負面字眼則由0.74%上升至1.24%,涉及前景不確定的用語,亦由0.39%上升至0.5%,故此被納入沽空名單之中。結果如何,在5月至10月間長實股份回報率為7.8%,並不算差,這亦可能與公司該年宣佈架構重組,由長實分拆出長和及長江地產有關。
另一項要留意的是,與上述的研究不同,主席報告的篇幅一般較管理層討論的字數少得多,意味可供分析的字數較少,而我的感覺是內容越長越好,樣本太少反而會扭曲相似度。
同時,美國公司有集體訴訟,管理層生怕日後出事會被股東指控隱瞞,因此總會在年報中為公司面對的風險漏些少口風,留作日後傍身之用,香港公司似乎便沒有這種需要,或會因而影響輸出的結果。
無論如何,這是以程式分析年報內容來訂定投資策略的一個嘗試,若能有整個港股的數據作輸入,結果應會更有趣。不可不提的是,港交所上刊載的公司年報仍然是pdf格式,這對於從事這類大數據的研究,絕對是一個障礙,希望口口聲聲重視金融科技的李小加,能改善這問題。
作者簡介:一個有IT背景的交易員,遇上由財經轉戰編程的IT初哥,大家都信投資的未來要靠科技,人機合一必有所得。
作者電郵:mailto:
[email protected]*Cohen, Lauren and Malloy, Christopher J. and Nguyen, Quoc, Lazy Prices (September 2018). NBER Working Paper No. w25084.
★ https://sraf.nd.edu/textual-analysis/resources/