애널리스트 보고서 텍스트의 주가예측력에 대한 검증
Verification on stock return predictability of text in analyst reports
Korean J Appl Stat 2023;36(5):489-499
Published online October 31, 2023
© 2023 The Korean Statistical Society.

이영선a, 야마다 아키히코b, 양철원c, 노호석1,a,d
Young-Sun Leea, Akihiko Yamadab, Cheol-Won Yangc, Hohsuk Noh1,a,d

a숙명여자대학교 통계학과; b서울대학교 빅데이터 혁신융합대학; c단국대학교 경영학부; d숙명여자대학교 자연과학연구소

aDepartment of Statistics, Sookmyung Women’s Univesity;
bBigdata Convergence and Open Sharing System, Seoul National Univesity;
cSchool of Business Administration, Dankook Univerisity;
dResearch Institute of Natural Sciences, Sookmyung Women’s Univesity
1Department of Statistics, Sookmyung Women’s Univesity, Cheongpa-ro 47-gil 100, Yongsan-gu, Seoul 04310, Korea. E-mail:
Received April 7, 2023; Revised May 1, 2023; Accepted May 13, 2023.
온라인 플랫폼을 통한 애널리스트 보고서의 공유가 가능해짐에 따라 애널리스트들이 생성한 보고서는 시장 참여자들 간 금융 정보 격차를 줄일 수 있는 유용한 도구가 되었으며, 애널리스트 보고서의 정량적 정보가 주식수익률 예측에 다수 활용되었다. 하지만 상대적으로 애널리스트 보고서 내 텍스트 정보의 주식수익률 예측 정보력에 대한 국내 자료 기반 연구는 상대적으로 많이 부족하다. 본 연구는 애널리스트 보고서에서 추출 가능한 텍스트로부터 어조 변수를 생성하여 주식수익률 예측에 정보력이 있는지를 검증하되, 기존 연구들의 선형모형 가정 기반 검정의 한계를 해결하고자 랜덤 포레스트 기반의 F-test를 사용하여 기업수익률 예측력을 검증하였다.
As sharing of analyst reports became widely available, reports generated by analysts have become a useful tool to reduce difference in financial information between market participants. The quantitative information of analyst reports has been used in many ways to predict stock returns. However, there are relatively few domestic studies on the prediction power of text information in analyst reports to predict stock returns. We test stock return predictability of text in analyst reports by creating variables representing the TONE from the text. To overcome the limitation of the linear-model-assumption-based approach, we use the random-forest-based F-test.
주요어 : 주식수익률 예측가능성, 자연어 처리, 애널리스트 보고서, 랜덤 포레스트 F-test
Keywords : stock return predictability, natural language processing, analyst reports, random forest F-test
