넷플릭스가 데이터를 사용하는 방법을 천천히 알아보자 ①추천 알고리즘
OTT의 절대강자, 넷플릭스
유튜브와 넷플릭스, 그리고 아마존은 데이터 분석과 활용에 선두에 있으며 공개된 문서도 많은 편이다. 성능도 상당해서 사용자들사이에서 알고리즘을 칭찬하는 목소리가 높고 원리를 짐작하여 마케팅 방법을 알려주는 비즈니스도 다수 존재한다.
이 중 넷플릭스는 글로벌 플랫폼과 오리지널 컨텐츠를 무기로 영화관과 제작사들을 따돌리며 OTT라는 새로운 미디어 산업의 왕좌를 차지하고 있다.
단순 1위가 아닌 라디오, TV, 스마트폰으로 이어진 미디어의 변화와 영화관, 비디오대여점, 회원제 스트리밍으로 발전해간 매체의 변화를 캐치해낸 선구자이며, 플랫폼이라는 강점을 적극 활용하여 엄청난 자금으로 양질의 컨텐츠를 만들어 내고, 데이터를 적극 활용하는 빅테크기업으로 할 수 있는 건 모조리 하고 있는 완전 무결한 강자이다.
그 간 공개된 데이터로 소식을 자주 접하고 벤치마킹까지 했다보니, 이제와서 덩치를 키워 생존해보려는 국산 OTT업체(티빙과 웨이브 합병 발표)와 K-컨텐츠는 좋은데 플랫폼에서 왜 1위를 못하냐는 발언은 안타까운 생각마저 든다.
하지만, 어느 산업이든 절대강자는 없으며, 난장판 끝에는 새로운 질서가 생긴다. TV채널이 다양해진 것처럼 어쩌면 다양한 OTT의 시대가 올지도 모르는 마당에 1위가 아니면 어떠한가?
그간 데이터와 관련된 내용을 주로 다뤄왔지만, 이번엔 왜 분석을 해왔는지를 이해하기 위해 넷플릭스가 어떻게 발전해왔는지, 그리고 매 시기마다 무슨 결정을 해왔는지 천천히 이야기해보려고 한다.
연체료와 넷플릭스의 탄생
1997년 리드 헤이스팅스는 비디오 대여점에 테이프를 반납하는 걸 깜빡하고 연체료 40달러를 지불한 것을 계기로 하여 넷플릭스에 대한 아이디어를 생각하게 된다. 당시 대여료가 1~2천원정도 수준이었으니 5만원에 가까운 연체료는 이미 7억 5천만 달러에 소프트웨어 회사를 매각한 이력이 있는 부자에게도 상당히 열받는 금액이었던 것 같다.
여튼, 이 일을 계기로 넷플릭스는 연체료를 없애고 구독료를 지불하면 홈페이지에서 영화를 고르면 우편으로 비디오 DVD를 배송한 후 반납은 고객의 우편함에서 직원이 직접가져가는 새로운 대여 시스템을 구축하였다.
첫번째 데이터 활용 사례 - 추천 알고리즘
초창기 매출은 높지만 적자였던 넷플릭스가 흑자 전환에 성공할 수 있었던 건 기업을 공개한 후 유통 방식을 개선하고 추천 알고리즘을 적극적으로 도입한 것에 두고 있다.
넷플릭스 창업 당시 미국은 블록버스터라는 오프라인 비디오 대여점이 시장을 장악하고 있었다. 1985년에 설립된 이 기업은 한때 미국 전역에 3천여개의 체인점과 캐나다와 일본까지 포함하면 전세계에 9천여개의 매장을 가지고 있는 독점기업이었다.
하지만, 블록버스터는 2000년대에 들어 새로운 방식으로 대두되었던 온라인 DVD대여 사업에 적극 뛰어들지 않았으며, 오히려 오프라인 매장에 복합 쇼핑 공간을 만들었으며, 이로 인한 과도한 지출로 파산하게 된다.
마치 최근의 소비자들이 온라인 쇼핑몰이냐 오프라인 할인점이냐 선택의 기로에 놓여있는 것처럼 당시에는 오프라인 비디오 대여점과 온라인 대여 서비스에 대한 고민에 빠져있었던 것이다.
넷플릭스는 어떻게 이러한 변화를 이끌어냈을까? 배경에는 당시 비디오 대여와 넷플릭스의 구독서비스에 있다.
여러분들은 영화를 어떠한 기준으로 고르는가? 혹시 당시의 비디오 대여점에 경험해본 적이 있다면 신작이 대여료도 비싸고 반납기한이 짧았던 것을 기억하고 있을 것이다.
신작은 비싸기도 하지만 금방 동이 나기도 하고 이와 비디오를 반납하러 간김에 저렴하게 구작이라도 몇 편 빌려보려고 했다면, 리뷰하나 없이 케이스의 설명만으로 빌려야했으며, 성공률을 높이기 위해 장르와 감독을 기준으로 빌려본 경험이 있을지도 모른다.
건당 대여하는 오프라인 대여점에서도 이럴진대 직원하나 없는 온라인 매장에서 구독서비스를 운영하는 넷플릭스는 고객 만족도까지 지속적으로 관리하기위해, 비디오를 고르는 고객이 항상 만족스러운 선택을 할 수 있도록 도와야 했다.
그리고 고민 끝에 알고리즘 경연대회인 Netflex Prize가 개최되었다. 넷플릭스 프라이즈는 공교롭게도 2006년부터 블록버스터가 망하기 직전인 2009년까지 3년간 진행되었으며, 현재는 사용자의 프라이버시 문제로 더이상 진행은 되지 않고 있다. 하지만, 이 대회에서 협업 필터링하면 가장 자주 소개되는 알고리즘이 소개되었으며, 현재까지도 꾸준히 회자되고 있다.(관련 포스트 보기)
넷플릭스도 한 때 별점시스템을 운영하였지만, 현재는 선호도(좋아요)와 영화 정보를 다양하게 수집하고 분류하는 노력을 기울이고 있다. (참고 : 넷플릭스 고객센터의 추천 콘텐츠 시스템 작동 방법 안내페이지)
최근에는 영화정보를 입력하는 태거(Tagger)라는 직업도 자주 소개되고 있는데, 태거는 Data is everywhere라는 넷플릭스의 철학에도 걸맞는 방식으로, 매장에만 집중하는 오프라인 기업이 추천은 직원에게 떠넘기고 데이터는 전혀 기록 하지 않는 것에 비해 온라인 기업이 별도의 직군까지 만들어가며 데이터를 수집하려는 사례이기도 하다.
다음 포스트에서는 넷플릭스가 어떻게 영화를 파헤치고 이를 운용하고 있는지에 대해 좀 더 자세히 적어보려고 한다.
[전체 글 목록 ▼]
넷플릭스가 데이터를 사용하는 방법을 천천히 알아보자 ①추천 알고리즘
넷플릭스가 데이터를 사용하는 방법을 천천히 알아보자 ②의사결정
넷플릭스가 데이터를 사용하는 방법을 천천히 알아보자 ③데이터 수집