데이터를 활용해 기존 비즈니스 혁신하기 : P2P 대출사업 성공 사례
안녕하세요. @choigww입니다.
핀테크는 오늘날 P2P 대출을 포함하여 결제, 지점 없는 은행 (인터넷전문은행), 소셜뱅킹에서 개인 재무관리까지 그야말로 수많은 금융 분야에서 일어나고 있습니다. 핀테크 이전 세계에서의 금융이 구름 위 존재였다면, 핀테크는 그 구름 위의 금융을 지상으로 끌어내렸죠. 덕분에 점점 더 많은 사람들이 합리적인 비용을 지불하고 소규모 자본/예산으로 금융의 다양한 혜택을 누릴 수 있게 되었습니다.
오늘은 금융강국 영국에서 2005년 P2P 대출 사업을 세계 최초로 시작한 조파(Zopa)의 사례를 중심으로, 데이터 분석으로 간과된 가치를 재발굴하고, 비효율적인 기존 비즈니스를 혁신하는 것이 어떤 배경에서 어떻게 이루어졌는지를 살펴 볼 겁니다.
훌륭한 데이터 기반 의사결정의 사례, P2P 대출사업
source : 한겨례
"우리는 은행에서 이용하는 데이터를 더욱 현명하게 이용할 뿐입니다. 만약 당신이 우리에게 대출 신청을 하면 훨씬 더 저렴하게 대출을 받을 겁니다."
"데이터를 현명하게 이용함으로써 돈을 상환할 수단이 있을 뿐만 아니라 (이전 기록을 통해) 돈을 상환하는 성향이 있다고 입증되는 개인을 파악하는 능력을 갖추는 것이야말로 대출을 하는 사람에게 있어 난제가 아닌가 생각합니다."
_가일스 앤드류스(조파 CEO)
조파의 P2P 대출사업은 다음과 같은 질문에서 시작되었습니다.
왜 고객들은 금융 서비스에서
대기업보다 훨씬 불리한 거래를 하는 것일까?
그리고 그들은 이런 결론을 내렸다고 해요.
채권 시장이 효율성을 높이면서 중개 은행을 능가하고
대기업에게 더 높은 가치를 제공하는 방향으로 진화했기 때문
대기업은 돈이 필요하면 은행을 찾아가는 것이 아니라, 채권시장에 부채를 발행하는 형태로 자금을 조달합니다. 그리고 조파는 대규모 자본이 오가는 기업 수준이 아닌, 소비자 수준에서도 이러한 시장 모델이 가능하지 않을까 생각했죠.
조파는 공신력이 있다고 평가받는 제3자 데이터 뿐 만 아니라, 다양한 소비자 데이터를 수집 분석하여 "소비자 수준에서의 채권시장은 가능하다"라는 결론을 내렸다고 합니다. 빅데이터의 시대이기도 한 오늘날, 이것은 데이터 기반 의사결정의 훌륭한 사례이기도 합니다.
조파는 여기서 멈추지 않고, 공격적인 소비자 데이터 분석력을 여신결정에도 활용합니다. 많은 은행들이 여전히 과거의 평가기준과 과거의 기록을 토대로 개인 대출을 할 때, 조파는 새로운 기준을 적용한 여신평가 모델을 구축했습니다. 구체적으로는 대출자가 상환 능력/수단이 있는지, 그리고 돈을 상환하는 성향/인성을 지니고 있는지를 평가하는 모델을 개선한 것이죠.
이러한 데이터 기반 의사결정은 2005년부터 P2P 영역의 사업을 통해 수집해 온 방대한 소비자 데이터가 없었다면 불가능했을 것이란 점도 간과해서는 안 되겠죠. 정보기술 업계에서 남들이 갖지 못한 데이터를 대량으로 확보한다는 것의 의미는 매우 특별하니까요.
- 참고 : 인성평가를 활용한 신용평가 사례와 시사점 (pdf 다운로드 링크)
KB금융지주 금융연구소, 2015.03
간과된 기존 대출고객의 가치
"위험에 토대를 둔 우리의 가격 책정 모델에 따르면, 우리 회사 고신용 우수 대출자의 경우 전통적인 은행 신용카드보다 수백 혹은 심지어 수천 달러 정도를 절약할 수 있다. 전통적인 은행 신용카드는 그들에게 다른 사람과 똑같이 높은 비율을 부과한다."
"우리가 급속도로 성장할 수 있었던 한 가지 요인은 전통적인 모델에서 충분히 서비스를 받지 못했던 고신용 우수 대출자들 덕분이었다."
_르노 라플랑쉬 (렌딩클럽 CEO)
그래서 조파의 성공은 전통 금융권이 놓친, 또는 과소평가한 개인 대출 고객의 가치를 더 정확하게 평가하고, 그에 합당한 서비스를 제공한 것에서 기인한다고 말할 수 있습니다. 쉽게 말하면 기존 은행보다 그들을 더 정당하게 대접한 것입니다.
내로라하는 은행들이 역량 부족으로 개인대출자에 대한 여신평가를 과거 기준으로만 시행했을까요? 그건 아마도 아닐 겁니다. 이런 말이 있지 않나요. 당신이 생각한 건 누군가가 옛날부터 생각해온 것이거나 이미 현실화 되었다, 라는. 그저 은행의 제한된 리소스를 소규모 개인대출보다 더 돈이 되는 분야로 집중하는 전략이 금융권의 보수성과 결부된 결과가 아닐까 합니다.
그런데 새로운 평가 기준을 도입해서 기존의 여신평가 모델을 개선했다, 라는 말은 어쩌면 추상적으로 들릴 수도 있을 것 같습니다. 그래서 조금 더 눈으로 이해하는 방향은 없을까 생각하다가, 제가 데이터 사이언스를 공부하면서 진행한 분류 (classification) 모델 프로젝트를 들어 시각 자료와 함께 설명을 해 보고자 합니다.
이 프로젝트는 숲의 토양, 수원지와의 거리, 햇빛을 받는 각도, 언덕의 경사와 같은 다양한 지리기상학적 요인/변수를 가지고 숲의 주요 수목종(주요하게 자라는 나무의 종류)을 잘 예측하는 모델을 만드는 것이 목표입니다. 주요 수목종의 종류는 총 7개니까, 예를 들면 어떤 숲의 정보들을 모델에 입력하면 "이 숲의 주요 수목종은 3번 수목종일 것이다"라고 답해야 하는 것이죠.
왼쪽 이미지는 기본적으로 확보된 54개의 변수로 15,000개의 숲을 7개 수목종으로 "분류"한 결과를 차원축소 기법으로 사용하여 2차원으로 시각화 한 것입니다(실제로는 56차원이지만 핵심만 추려 2차원 액기스만 뽑았다고 생각하시면 될 것 같아요). 그리고 오른쪽 이미지는 252개의 추가적인 변수를 생성해서, 총 306개의 변수로 15,000개 숲을 7가지로 분류한 모습이에요.
오른쪽이 왼쪽보다 일단 더 깔끔해 보입니다. 구체적으로 보면 왼쪽은 같은 색깔임에도 불구하고 멀리 떨어져 있거나, 다른 색깔이 있는 곳에 엉뚱하게 섞여 있는 모습이 두드러집니다. 반면 오른쪽은 상대적으로 같은 색끼리 뭉쳐 있습니다.
15,000개의 숲 데이터로 "공부"를 마친 모델은 색깔별로 분류된 데이터를 바탕으로 아래와 같이 땅따먹기처럼 색깔별로 영역을 지어줍니다. 그래서 연초록 영역에 들어오는 새로운 데이터는 연초록으로 분류하고, 진한 빨강색 영역으로 들어오는 데이터는 진한 빨강색으로 분류합니다.
이상값들이 이곳저곳 남아 있어 깨끗하게 그려지지는 않았지만, 최초 54개로 데이터를 분류할 때보다 훨씬 더 정확하게 분류를 성공시키는 모델이 되었습니다. 왜냐하면 훨씬 더 다양한 측면에서 숲을 평가할 수 있었기 때문이죠. 기업에서 사람을 뽑을 때 평가 기준을 1개만 쓰는 것과 10개를 쓰는 것 사이에 어떤 차이가 있는지를 생각하면 더 쉽게 이해될 것 같습니다.
이것은 적은 개수의 변수를 사용한 모델은 데이터를 잘못 예측하는 경우가 많아진다는 것을 말합니다. 데이터 분석에서 너무 적은 변수로 모델링을 하면 데이터의 세세한 부분을 고려하지 못하는 언더핏(underfit)이 발생한다고 이야기하고, 이는 "과소평가"와 맥락적으로 유사한 의미를 갖습니다. 반대로 너무 변수를 많이 사용하면, 특정 사례에 지나치게 많은 비중을 부여해 일반성을 잃어버리는 오버핏(overfit)이 발생한다 말하고, 이는 "과대평가"와 유사한 맥락을 가지고 있어요.
전통적인 은행의 개인대출 여신평가 모델은 적은 변수만을 사용해 기대상환력이 매우 높은 고객의 신용등급을 과소평가하기 쉽고, 이는 기대수익의 상실을 의미합니다. 이 아쉬운 부분을 데이터 활용으로 개선해 더 좋은 모델을 만든 것이 조파를 비롯한 여러 P2P 대출 기업이 은행 이상의 경쟁력을 확보한 원천이죠.
기존의 평가체계에 효과적인 평가 기준을 추가함으로써 간과되거나 잘못 평가된 고객의 가치를 재발견/재평가하고, 그에 따라서 더 합리적인 서비스를 제공하는 것. 기성의 전통 산업의 파이 일부를 빼앗고자 하는 야심찬 도전자에게 매우 효과적인 전략임은 두말할 필요가 없을 겁니다.
데이터를 활용한 기존 비즈니스 혁신 사례로서의 P2P 대출
그래서 P2P 대출의 성공 요인은 이렇게 정리할 수 있을 것 같습니다.
좁은 시장(틈새)의 비효율적인 비즈니스 프로세스 또는 요소의 혁신
- 은행은 소규모 개인대출보다 장기 주택담보대출, 대기업 대출상품에 더 큰 관심
- 기존 개인대출을 위한 여신평가 모델을 개선하여 은행이 놓친 우수 대출자 발굴
- 낮은 수익성으로 소외된 금융의 좁은 분야에 집중, 은행보다 높은 효율성을 달성
(경상비, 점포 운영비 일체를 배제해 3% 수준의 수수료만으로 수익 창출 가능)
이러한 경우는 기존의 거대 산업, 또는 주류 플레이어들이 이미 잘 하는 것이 아니라 놓치고 있는 좁은 분야를 특정하여 그것을 개선, 혁신했다고 할 수 있습니다. 그리고 그러한 개선과 혁신의 중심에는 누구나가 중요하다고 외치지만 그다지 와닿지 않는 '빅데이터' 또는 더 쉬운 말로 데이터 분석이 자리하고 있습니다.
개인적으로는 제가 데이터 분석을 따로 공부한 이유도, 이런 일에 관심이 있기 때문입니다. 남들이 못 보고 있는 걸 찾는 게 저는 왜 이렇게 좋은 것일까요.
재밌게 읽으셨다면 무척 기쁘겠습니다. 그럼 20000!
REFERENCE
- <핀테크 전쟁>, 브렛 킹 저, 이미숙 역, 2015.06, 도서출판예문