Earticle

현재 위치 Home

기업신용등급 예측을 위한 랜덤 포레스트의 응용
Application of Random Forests to Corporate Credit Rating Prediction

첫 페이지 보기
  • 발행기관
    경성대학교 산업개발연구소 바로가기
  • 간행물
    산업혁신연구 KCI 등재 바로가기
  • 통권
    제32권 제1호 (2016.03)바로가기
  • 페이지
    pp.187-211
  • 저자
    김성진, 안현철
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A267418

※ 기관로그인 시 무료 이용이 가능합니다.

6,300원

원문정보

초록

영어
There has been a lot of research on intelligent information processing techniques to effectively and efficiently manage credit risk in the financial industry. To predict corporate credit ratings better, various algorithms of machine learning have been proposed and applied. However, the algorithms have some limitations. First of all, they are unable to give a solution for which variables in the dataset should be considered as input variables to effectively predict a dependent variable. Also, they are easily exposed to overfitting and risk being affected by outliers and noise. In addition, they are required to tune their numerous parameters. Under this background, this study proposes the application of Random Forests(RF) to overcome the weakness of the traditional techniques. RF were designed by Leo Breiman, an American statistician and professor, and are an ensemble learning technique. This algorithm has both features originating from bagging algorithm, which is to extend a single decision tree to various decision trees, and from random input selection. The benefit of our proposed algorithm is free from an overfitting issue, and both noise and outliers in the dataset cannot have an effect on it. Thus, our model can yield high accuracy in forecasting corporate credit ratings. To validate the effectiveness of RF in predicting corporate credit ratings, we applied it to a real world dataset of corporate credit rating in Korea. The data that we used for this research consisted of various financial ratios of 1,295 corporations and their corporate credit ratings. To evaluate and compare our model with traditional methods, we used the following methods: MDA(Multiple Discriminant Analysis), ANN(Artificial Neural Network) and MSVM(Multiclass SVM). Each model’s performance was calculated by predictive accuracy based on training and validation. Empirical results showed that RF outperforms other traditional methods from the perspective of prediction accuracy.
한국어
지금까지 금융기관의 신용위험관리를 효과적이고 효율적으로 수행하기 위한 지능형 기술에 대한 연구가 활발하게 이루어져 왔다. 특히 기업의 부실 예측이나 신용등급 예측 문제를 해결하는데 있어, 다양한 기계학습 분류 알고리즘들이 제안되고 적용되어 왔는데, 이들은 효과적인 입력변수 선정에 대한 해답을 제공해 주지 못하고, 과적합 및 잡음·이상치에 취약할 수 있는 위험이 있으며, 각종 모수에 대한 조정 작업이 요구되는 한계점이 있었다. 이러한 기존 기법들의 한계를 극복하기 위한 대안으로 본 연구는 랜덤 포레스트(Random Forests)의 응용을 제안한다. 미국의 통계학자 Breiman(2001)에 의해 제안된 랜덤 포레스트는 배깅(bagging)과 무작위 입력 변수 선택(random input selection)을 통해 단일 의사결정 나무를 다수의 의사결정 나무로 확장시킨 기계학습 기법이다. 랜덤 포레스트는 과적합에서 자유로우며, 잡음이나 이상치에 받는 영향이 적고, 높은 정확도를 얻을 수 있는 특징을 지닌다. 본 연구에서는 기업신용등급 예측에 랜덤 포레스트 기법을 적용해 보고, 그 성과를 전통적으로 사용되어 온 다른 기법들과 비교하여 예측성과의 개선이 있는지 확인해 보고자 하였다. 이를 위해 본 연구에서는 1,295개 국내 상장기업을 대상으로 하는 기업신용등급 평가모형 구축에 랜덤 포레스트를 적용해 보았다. 제안된 기법의 성과를 비교평가하기 위한 전통적인 분류 기법으로는 다중판별분석, 인공신경망, 다분류 SVM 모형을 사용하였다. 실증분석 결과, 제안 기법이 전통적인 기법들과 비교해, 보다 정확한 예측결과를 산출함을 확인할 수 있었다.

목차

논문초록
 I. 서론
 II. 이론적 배경
  2.1 기업신용등급 평가
  2.2 Random Forests
 III. 연구모형
 IV. 실증분석
  4.1 실험데이터
  4.2 비교모형 설정
  4.3 실험결과
 V. 결론
 참고문헌
 Abstract

키워드

랜덤 포레스트 신용위험관리 기업신용등급평가 다분류 분석 데이터 마이닝 Random Forests Credit Risk Management Corporate Credit Ratings Multiclass Classification Data Mining.

저자

  • 김성진 [ Seong-jin, Kim | 국민대학교 비즈니스IT전문대학원 석사과정. ] 주저자
  • 안현철 [ Hyun-chul, Ahn | 국민대학교 비즈니스IT전문대학원 부교수 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    경성대학교 산업개발연구소 [INDUSTRIAL DEVELOPMENT INSTITUTE KYUNGSUNG UNIVERSITY]
  • 설립연도
    1985
  • 분야
    사회과학>지역개발
  • 소개
    연구소는 경영및 경제 전반에 관한 이론과 실무의 연구개발을 통하여 산학협동을 기하고 이를 토대로 국민경제의 발전에 기여함을 목적으로 한다

간행물

  • 간행물명
    산업혁신연구 [The Journal of Industrial Innovation]
  • 간기
    계간
  • pISSN
    2005-2936
  • eISSN
    2800-0080
  • 수록기간
    1985~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 325 DDC 658

이 권호 내 다른 논문 / 산업혁신연구 제32권 제1호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장