해당 논문은 2018년 발표된 논문으로 현재와 시간차가 있다.
기존에는 재무지표만으로 기업의 신용등급을 평가하였으나,
이 논문에서는 소셜미디어에서 기업에 대한 감정 분석한 결과를 추가하여 실험을 진행하였다.
소셜 미디어와 뉴스 콘텐츠는 주식 수익률과 위험에 영향을 미치며, 그것이 기업 신용 품질에 영향을 미치기 때문에
해당 논문에서 트위터에서 해당 기업에 대한 언급이 포함되어 있는 글에서 8가지 기본 감정에 대해 분석하여 독립변수로 함께 사용하였다.
1. 데이터를 수집 (분기별 재무지표 + 기업 언급한 트위터 게시물)
2. 트위터 게시물 감성분석
3. 해당 데이터를 토대로 Random Forest 사용
감정 분석을 할 때 사용한 기분은 LDA에서 파생된 ELDA인데
이것은 문서의 집합으로부터 어떤 감정이 존재하는지 알아내기 위한 알고리즘이다.
독립변수로는 DTA, ROA, IC, 기업규모, 자본집약도, 범주형 지표 + 감정분석 데이터를 썼다고 하고,
종속변수로는 매 분기 말 S&P에서 발행하는 장기신용등급으로 지정했다고 한다.
모델링 결과는 평균적으로는 재무지표 + 소셜미디어가 좋다.
어떤 지표를 더 중요하게 볼 거냐에 가중치를 두어야겠지만 어느정도 감성분석한게 좋다고 할 수 있다.
해당 논문의 결론은 결국 소셜 미디어 게시물의 감정 정보가 기업 신용평가에 도움이 되며,
해당 방법은 재무 정보만을 사용한 모델에 비해 정확도가 높고
Random Forest는 다른 방법론(SVM 등..)에 비해 정확도가 높다고 이야기 한다.
댓글