신용평가모형 개발 프로세스 요약
신용평가모형 개발 프로세스
개인 신용평가모형 개발은 일반적으로 아래와 같이 진행됩니다.
- 데이터 추출
- 데이터 전처리
- 요건정의
- 모형개발
- 모형검증
데이터 추출
데이터 추출 단계는 분석할 데이터를 모으는 단계입니다. 신용평가 모형 개발자는 본인이 분석할 데이터를 직접 추출할 수 있어야합니다. 보통 전체 Database에서 필요한 Table들을 추출합니다. 직접 데이터를 추출하지 않더라도, 추출 요건을 작성하여 담당자에게 데이터를 요청합니다. 동시에 데이터 적재 환경을 이해하며 추출한 Table 들의 성격 및 Layout을 파악합니다. 일반적으로 추출하는 Table들은 다음과 같습니다.
- 고객정보: 신청원장, 고객원장, 잔액장 등
- 연체정보: 일일연체원장 등
- 모형정보: 심사Input Table, 심사결과 Table 등
- 부도정보: 부도, 상각, 매각, 회생/파산 Table 등
- 외부정보: 신용정보원 계좌별 대출정보 Table, CB사(NICE / KCB) 요약항목 Table 등
데이터 전처리
데이터 전처리 단계에서는 추출된 데이터를 분석 가능한 형태로 가공합니다. Table의 모든 항목들 중 필요한 항목과 불필요한 항목을 선별합니다. 누락 데이터를 처리하거나, 정보의 정합성을 확인합니다. 신용평가에 알맞은 분석항목을 생성하는 과정도 진행합니다.
요건 정의
신용평가모형 개발을 위해서, 모형 설계를 위한 환경을 정의합니다.
- 개발 모집단 정의: 전체 가용 데이터 중, 모형 개발 데이터 / 검증 데이터 / 미사용 데이터를 분류
- Target 정의: 기본적으로 신용평가 모형은 분류(Classification) 모형으로, 모형이 예측할 Target 정의가 필요
- 모형 세분화 정의: 특정 기준에 의해 데이터를 나누고, 데이터 별 모형을 각각 개발
모형 개발
정의된 요건에 맞게 신용평가 모형을 개발하는 단계입니다. 기존 운영중인 모형이 있다면, 해당 모형의 문제점을 개선하는 방향으로 진행합니다. 기존 모형이 없더라도, 성능 지표와 안정성 지표를 확인하며 모형을 개발합니다. 모형의 성능을 높이기 위해 추가적으로 분석 항목을 생성하기도 합니다. 만들어진 신용평가 모형이 유관 전략에서 활용될 수 있도록 모형 결과를 등급형태로 변환하는 작업도 수행합니다.
모형 검증
만들어진 모형이 이상이 없는지 최종적으로 점검합니다. 먼저 모형 레벨에서 성능 및 안정성에 문제가 없는지 확인합니다. 그리고, 활용 항목 수준에서 개별 항목의 성능 및 안정성을 테스트합니다.