기업의 데이터 분석 19

2.6. 외부 통계자료(데이터) 결합 분석

앞선 단락에서는 내부 데이터를 이용해 시장 변화와 소비행태를 분석하는 방법을 알아보았다. 하지만, 새로운 시장에 진출하거나 다른 업종과 연계를 계획하고 있다면 내부 데이터만으로는 자사 고객이 다른 업종에서 어떤 상품을 구매하고 선호하는지 파악하기 쉽지 않다. 이번 포스트에서는 외부 통계자료와 데이터를 활용하여 자사 데이터와 결합한 후 인사이트를 도출하는 방법을 알아보자. 10. 코호트로 구분된 외부 통계자료 활용 인사이트 도출 산업별 협회와 공공기관 또는 통계청 등에서는 업종과 관련되어있는 현황 또는 조사자료 등을 홈페이지에 제공하고 있다. 이 중 연령, 성별, 지역 등의 인구통계학적 속성에 의해 구분된 통계자료는 앞선 단락에서 설명했듯이 코호트에 의한 동질성을 가지기 때문에 내부 데이터와 결합하여 통계..

2.5. 행동 기반 세그먼트 생성 및 인사이트 도출

소비자는 각자의 상황과 취향에 따라 상품과 서비스를 선택하며 가격, 유행과 같은 시장 환경에 영향을 받는다. 앞서 설명했던 코호트를 비롯하여 피어 그룹, 페르소나와 같이 사회구성원으로 구분되어 행동에 제약을 받거나 유사한 선택을 강요받기도 하지만, 개별 인격체로써 스스로 다양한 선택을 하기도 한다. 이러한 소비자의 선택은 전 세대에 걸쳐 나타나기도 해서 인구통계학적인 속성으로 구분 짓기 어렵지만, 시대에 따라서 시장 전체를 좌우하는 중요한 세그먼트를 형성하기도 한다. 이번 포스트에선 고객의 행동을 기반으로 세그먼트를 생성하고 이를 토대로 시장과 소비자에 대한 인사이트 도출 방법을 알아보자. 8. 레퍼런스 그룹 활용 시장 트렌드 분석 기업은 소비자에 따라 변화하는 시장 트렌드를 모니터링하고 이에 대한 대응..

2.4. 수치형 자료 분류와 인사이트 도출 방법

데이터를 분석할 때 수치형 자료는 보통 합계와 개수 등을 산출하거나 세그먼트별 평균을 통해 비교하는 방식으로 많이 이용된다. 앞서 데이터 요약글에서도 설명했듯이 수치형 자료를 집계하는 방법은 크기, 대표값, 분포, 범위(순위)로 나눌 수 있지만, 인사이트를 도출하기 위해서는 세그먼트간의 비율, 비중이나 기간별 추세 등을 계산해야하며, 수치를 가공하는 것은 결국 세그먼트 또는 디멘젼이 가진 값을 비교하기 위함이므로 원래의 값을 해치지 않는 선에서 각 세그먼트가 가진 특징을 파악하는 것이 중요하다. 아래는 일반적으로는 잘 쓰이지 않지만, 통계분석에서는 이용하는 방법으로, 계산이 어렵지 않으므로 개념을 한번만 익히고 나면 실무에서 유용한 수치형자료 가공방법이다. 6. 정규화 활용 수치 비교 비교를 통해 분석하..

2.3. 날짜 및 경과에 따른 인사이트 도출 방법

날짜와 시간은 데이터가 생성된 시점에 불과하기도 하지만, 거의 모든 데이터는 시간에 구애받기 때문에 분석할 때 날짜/시간이 가지는 속성을 활용하면 다양한 인사이트를 도출할 수 있다. 특히 기업은 매출과 재고 등에 밀접하기 때문에 날짜에 대한 분석은 필수적이다. 아래 날짜/시간이 가지는 속성과 이를 활용한 분석방법과 경과분석에 대한 방법을 알아보자. 4. 날짜/시간별 데이터 비교 뉴스의 경제 또는 사회면에서는 최근 경기와 기업의 실적에 관해 얘기할 때 자주 쓰는 ‘작년 동기보다 증가’ 또는 ‘지난달에 이어 상승’과 같은 문구를 자주 사용한다. 날짜/시간별 비교는 흔히 사용하는 방법이지만, 정확한 활용을 위해선 날짜와 시간이 가지는 속성 3가지를 알아둘 필요가 있다. 구분 분류 예시 분석 방법 자연 현상 계..

2.2. 세그먼트/코호트 기반 인사이트 도출 방법

기업은 아주 작은 규모라고 하더라도 역할에 따라 지식과 경험이 다른 담당자가 서로 업무를 지원하는 구조로 운영된다. 그래서 자료를 주고받을 때는 누구나 쉽게 이해할 수 있는 용어와 일반적인 상식으로 논리적으로 진행되어야 한다. 데이터 기반 인사이트 역시 결과와 도출과정 모두 부서 간 공감대를 얻는 방법으로 진행되어야 하며 생소한 단어와 설명하기 어려운 방법은 서로의 지식을 통한 보완을 거치지 못하며, 결과물에 대한 불신으로 이어지게 된다. 이러한 측면에서 시중에 나와 있는 데이터 분석 방법들은 대부분 컴퓨터공학과 통계학을 바탕으로 복잡한 프로그램과 수학 공식으로 구성되어 있어서 비전공자가 배우기 어려울 뿐 아니라, 도출과정 역시 기업 현장에서 사용하기엔 적합하지 않다. 게다가 데이터 자체에 대한 설명은 ..

2.1. 데이터를 요약하는 방법(엑셀 피벗테이블 및 차트)

업무 환경에서 자주 접하는 장표 작성에도 사실 요령과 규칙이 있다. 하지만, 대부분 선배의 장표를 따라하거나, 이리저리 시도하다가 겨우 만든 장표를 반복해서 사용하는 경우가 많은데, 통계 또는 데이터 관련 학과를 전공했거나 이미 연차가 꽤 쌓인 분석가인데도 요약에는 잼병인 경우도 가끔 보곤 한다. 장표 작성과 같이 데이터를 요약하는 과정은 어지럽게 쌓여 있는 데이터를 일목요연하게 정리하고 필요한 정보를 찾아내는 과정으로 최근 강조되는 '데이터 리터러시' 의 첫번째 단계이기도 하다. 사회생활을 막 시작한다면 꼭 읽어보길 바라며, 요약에 자신 있다고 해도 데이터 요약만 따로 가르치는 경우는 많이 없으니 아래에 정리해본 내용으로 가볍게 한번 되짚어보길 바란다. 엑셀을 이용한 데이터 요약의 기초 1. 데이터와 ..

1.3. 데이터로 할 수 있는 업무 영역

기록이든 흔적이든 기업의 여러 장소에서 수집된 데이터를 다시 여러 부서가 사용하게 하려면 데이터를 어떻게 활용할지 계획을 수립하고 이에 걸맞는 시스템이나 인력 등을 준비해야한다. 다른 기업의 사례를 참조하는 것도 좋지만, 자사에 업무환경에 맞춰 시스템을 구비하기 위해서는 데이터 활용 업무 영역에 대해서 본질적인 목적을 정리 해보는 것도 좋은 방법이다. 데이터가 사용되는 모든 장소를 통틀어서 데이터를 이용하는 최종 목적은 ‘요약’, ‘추론’, ‘예측’ 3가지이다. 보고서를 작성하든 마케팅에 활용하든 데이터는 해당 업무에서 3가지 역할을 하게 된다. 1. 데이터를 활용한 ‘요약’ 조선시대에 있었던 사례를 보며 ‘요약’의 의미를 짚어보자. 정조는 아버지 사도세자의 묘소인 현륭원 식목 사업을 마무리 짓고 논공행..

1.2. 기업의 데이터 수집에 대한 현실적인 지침

업무 환경에서 ‘데이터’란 보통 DBMS에 저장된 데이터베이스를 지칭한다. 데이터베이스를 줄여 부르면서 생긴 단어이기도 하지만, 기업의 핵심 장표와 서류, 그리고 웹사이트의 고객 및 주문정보까지 모두 DBMS에 저장되어 있으니, 단어만 놓고보면 데이터베이스를 떠올리는 건 당연할지도 모른다. 80년대 전산화가 시작되면서 수기로 관리하던 원장과 장표들은 전산화된 시스템으로 이동하였으며, 캐비넷에 서류를 보관하고 찾던 방식은 DBMS에서 통합 조회하는 방식으로 바뀌었다. 전산화로 비롯된 데이터 관리 시스템은 행과 열로 구성된 정형 데이터 체계를 채택하였고, 관리와 집계의 편의성을 위해 규칙을 정한 후 항목과 수치만 간략하게 기록한다. 이 과정에서 데이터시 조금 소실될 수는 있지만, 그동안은 그다지 이슈가 되진..

1.1. 데이터를 활용하지 못하는 기업의 특징

근래에 커뮤니티에서 PTSD(외상 후 스트레스 장애)라는 단어가 자주 눈에 띄는데, 대부분 과거 겪었던 사건을 떠오르게 하는 상황이나 인물에 대해 'PTSD 온다'라는 표현을 사용하며, 당시에 겪었던 심적 고통으로 이후 정상적인 생활이 어려웠음을 토로하는 내용이 주를 이루고 있다. 최근 챗GPT열풍이 시작되며 변화를 두려워하고 도태를 걱정하는 기업들을 보다보면 국내 기업들은 모두 데이터에 대한 PTSD를 가지고 있지 않을까 라는 생각이 들곤 한다. 챗GPT이전에도 CRM(1997년), 빅데이터(2011년), 알파고(2016년)와 같이 데이터와 AI에 대한 열풍이 있었다. 당시에도 수 많은 기업들이 지금처럼 두려움을 가지고 신기술을 받아들였으나 몇몇 기업들은 효과를 거두지 못하고 정말로 도태되기까지 하였으..

반응형