세줄 코딩(실무용 알고리즘)

상품 추천 알고리즘 - 협업 필터링 vs. 연관분석

정데만 2023. 8. 24. 11:05
728x90

이커머스의 추천 알고리즘

앞서 추천 알고리즘을 소개하면서 아마존에서 상품 기반 협업 필터링을 이용해 관련 상품을 추천하는 것을 소개하였다. 아마존의 상품 기반 협업 필터링은 무려 25년 전인 1998년도에 발표된 것으로 당시 1~2페이지를 보는 것도 버거웠던 인터넷 환경에서 사용자의 무한 클릭을 유도하면서 종합쇼핑몰로 발전하고 개인화에 앞서나가게 하는데 일조하였다.

 

 

Amazon.com (1998.10.7)

 

 

그러나 아마존이 처음 협업 필터링을 적용했던 이커머스 초창기에 대부분의 쇼핑몰들은 알고리즘이 아닌 신문, 잡지와 비슷한 편집장 시스템을 운용하면서 상품을 소싱하는 MD(Merchandiser)가 직접 노출을 결정했다.

 

그도 그럴것이 당시엔 느린 배송 시스템과 매입 방식으로 이커머스의 점유율이 낮았고, 이로 인해 상품을 소싱하는데 어려움을 겪었기 때문에 - 브랜드 퀄리티가 떨어진다는 이유로 일부 상품은 비대면 판매가 금지되기도 하였다 - 힘들게 확보한 상품을 밀어내려면 여백이 조금이라도 생겼을 때 전략 상품부터 노출해야 했기 때문이다.

 

이 같은 상품 노출 방식은 옥션, 지마켓 같은 오픈마켓 플랫폼이 등장하면서 변화하기 시작하였다.

 

오픈마켓은 직매입이 아닌 중개방식이기 때문에 이커머스에 등록된 상품 수가 폭발적으로 증가할 수 밖에 없다. 또한 판매자를 상품 관리 및 광고 기반 노출 시스템이 운영해야하며, 같은 상품을 여러 판매자가 경쟁하며 사용자 후기 데이터도 정교해야 한다.

 

이커머스의 플랫폼 전환은 데이터와 시스템의 전반적인 변화를 가져왔고, 스마트폰이 등장하면서 효율적으로 상품을 노출하기 위한 개인화가 중요해지면서 상품 노출에 추천 알고리즘이 광범위하게 적용되고 있다. 

 


 

상품 기반 협업 필터링 vs. 연관분석

"A상품을 사는 사람들이 B상품도 구매하더라" 라는 메시지를 가지고 있는 상품 추천은 사용자의 속성(연령, 성별 등) 데이터가 없어도 상품 조회 및 구매 만으로 유사 성향의 고객을 찾아 내 추천할 수 있으며, 밴드웨건 효과(Bandwagon Effect, 군중심리)를 자극하면서 의사결정을 촉진시키는 장점도 가지고 있다.

 

상품 추천 시스템에는 다양한 알고리즘이 적용될 수 있는데, 앞서 소개했던 협업필터링과 연관분석이 가장 많이 이용되며, 고객에게 노출되는 메시지는 비슷하지만 분석 결과와 적용되는 방식은 조금 다르다.

 

두 알고리즘 간의 가장 큰 차이점은 협업필터링은 상관관계 또는 유사도를 기반으로 동작하지만, 연관분석은 교집합을 기반으로 연관성을 산출한다는 데 있다.

 

상관관계와 연관분석의 차이

 

이러한 알고리즘의 차이점은 다음과 같은 특정과 적용 방식으로 정리된다.

 

구분 상품기반 협업 필터링 연관분석(장바구니 분석)
연산 방식 상관관계 기반
(같은 방향으로 증감하는 강도)
교집합 기반
(장바구니에 같이 담겨있는 비율)
알고리즘 구조 상품마다 타 상품과 1:1 계산
(특정상품의 구매데이터를 다른 상품의 구매데이터와 비교)
상품마다 주문내역을 1:n 계산
(특정상품이 포함된 구매데이터에서 다른 상품의 비율을 계산)
특징 사용자의 개인 선호도(평가점수, 구매횟수 등)에 따라 선호 상품 추출 가능 상품과 연관성이 높은 1개이상의 상품을 세트로 추출 가능
추천 방식 타 상품의 유사도 순위대로 노출 연관지표가 높은 세트상품(1개이상) 노출

 

분석결과로 인해 발생하는 차이점은 협업 필터링이 평가점수와 구매횟수 등 복잡한 수치를 계산할 수 있는 반면, 연관분석은 상품이 포함된 비율만 계산할 수 있는 대신 다양한 세트상품을 뽑아낼 수 있다는 것이다.

 

그래서, 협업필터링은 개인화된 상품 추천에 자주 활용되며, 연관 분석은 상품 노출 또는 세트상품 구성에 많이 활용된다.

 

다음 포스트에서는 연관분석 방법에 대한 설명과 파이썬을 활용한 분석방식에 대해 자세히 설명하고자 한다.


728x90