쉽게 쓴 데이터·AI 지식/데이터

코호트 분석의 정의와 이론적 배경

정데만 2024. 1. 23. 11:29
728x90
 

 

 

코호트 정의

 

  • 코호트는 로마 군대의 세부 조직에서 유래된 말로 같은 공간에서 훈련을 받아서 비슷한 성향을 가지게 된 것에서 유래되었다.

  • 통계학에서는 "공통적인 특성을 가진 사람들의 집단"을 뜻하며, 오랜 시간 추적조사를 통해 출생코호트 등에서 유사한 행동을 하는 것을 연구하였다.

  • 사회학에서는 "같은 시기를 살아가면서 특정한 사건을 함께 겪은 사람들의 집합"을 일컫는다.


 

코호트 활용 목적

 

  • 코호트 분석의 목적은 동일한 세대, 입학, 경제 상황, 사건 등과 같은 공통 조건 또는 경험을 가진 사람들의 집단 간의 비교를 통해 시간에 따른 패턴, 트렌드, 행동 변화를 분석하는 것이다.

  • 코호트 분석은 비슷한 시작점을 가지고 있는 여러 그룹 간의 비교 통해 발생하는 변화를 파악할 수 있다. 예를 들어 같은 연도에 동일한 대학에 입학한 학생들이 같은 기간에 취업한 직원들을 분석할 수 있다.

  • 코호트 분석에서는 범주형 변인(Categorical variable)에 따라 코호트를 나눌 수도 있으며, 예를 들어, 연령 코호트(Age cohort), 입학 코호트(Entrance cohort), 또는 사건 코호트(Event cohort)들을 마련하고 각 그룹에 따른 결과와 변화를 비교한다.

  • 코호트 분석은 마케팅, 경영학, 상담, 공중보건, 사회학 등 여러 영역에서 활용되며 시간이 지남에 따라 발생하는 행동, 성, 소비 패턴 등을 비교하고 분석할 수 있어, 고객의 니즈를 이해하고 전략적인 의사결정을 하는 데 도움을 준다.

  • 마케팅에서는 시간 또는 이벤트를 공유하는 사용자 그룹의 행동을 추적하는 데 유용하며, 사용자를 가입 연도, 구매한 제품 유형 그리고 열람한 웹 페이지 등으로 그룹화할 수 있다.

  • 코호트를 나눈 후에는 행동 패턴이나 유지/이탈률을 비교할 수 있으며, 특정 코호트의 이탈률이 높다면 해당 시점의 사건(광고, 이벤트 등)을 통해 원인을 유추할 수 있다.

  • Google Analytics, Adobe Analytics 등의 웹사이트 분석툴에서는 기본적으로 코호트 분석을 제공한다.

  • 참고로 의학에서는 "특정 질병 발생에 관여할 것으로 의심되는 특정 인구 집단"을 말한다.
  • 코로나 등의 감염병이 발생한 의료기관을 통째로 격리하는 "코호트 격리(Cohort Isolation)"의 코호트도 같은 의미이다.

  • 코호트 격리는 바이러스에 노출된 환자와 의료진을 동일 집단으로 간주하여 확산을 줄이는 것이 목적이다. 

 


728x90