運用文字探勘分析非量化資訊協助投資人預測公司財務表現
藉由對數字和文字形式的資訊進行分析,以協助使用者有效率地分類閱讀這些非結構化文字資訊。本研究針對2002年至2011年的上市半導體公司,使用TFIDF分析非量化的資訊,並結合量化資訊的K-Means分群分析,進而對財務表現進行預測。希望能協助投資人有效降低投資風險,創造更大的報酬。以本研究之方法進行財務表現之預測,最後的預測相符率可接近60%,詳細分析後發現下列現象:一則是公司發佈較多未來的資訊導致了文件相似度計算的失真;二則是相同K-Means分群的公司,可能使用不同字眼(保守或是不保守),闡述公司的表現,使TFIDF計算過程受到影響;三則是成長率對於經濟環境變動的反應最為明顯。但無論其原因...
Main Author: | |
---|---|
Language: | 中文 |
Published: |
國立政治大學
|
Subjects: | |
Online Access: | http://thesis.lib.nccu.edu.tw/cgi-bin/cdrfb3/gsweb.cgi?o=dstdcdr&i=sid=%22G0993530381%22. |
Summary: | 藉由對數字和文字形式的資訊進行分析,以協助使用者有效率地分類閱讀這些非結構化文字資訊。本研究針對2002年至2011年的上市半導體公司,使用TFIDF分析非量化的資訊,並結合量化資訊的K-Means分群分析,進而對財務表現進行預測。希望能協助投資人有效降低投資風險,創造更大的報酬。以本研究之方法進行財務表現之預測,最後的預測相符率可接近60%,詳細分析後發現下列現象:一則是公司發佈較多未來的資訊導致了文件相似度計算的失真;二則是相同K-Means分群的公司,可能使用不同字眼(保守或是不保守),闡述公司的表現,使TFIDF計算過程受到影響;三則是成長率對於經濟環境變動的反應最為明顯。但無論其原因為何,只要量化資訊有所改變,非量化資訊就會有所變化。投資人便可從非量化資訊內容的變化,進而預測下一年度的量化資訊,藉以減少投資的風險,制定正確的決策。 |
---|