쉽게 쓴 데이터·AI 지식/데이터

데이터 분석 실무의 핵심! 드릴 다운(Drill-Down)

정데만 2023. 6. 23. 15:00
728x90
 

 

인간은 새로운 지식나 정보를 처리할 때 개체를 나누고 쪼개어 종전에 알고 있던 사실과 비교하여 이해한다.

 

나눌 분(分)과 쪼갤 석(析)으로 이루어진 분석(分析)이란 단어는 인간의 해석 방식을 그대로 반영하는 단어로, 인간은 성장하면서 개체가 남긴 흔적이나 사건에 대한 관찰 기록을 자연스럽게 나누고 숨겨진 속성을 파헤쳐서 새로운 정보를 습득한다.

 

분석이 인간의 기본적인 정보처리 능력이라서 그런건지 실무에서도 업무를 오래한 직장인은 분석 방법을 따로 배우지 않아도 엑셀에 기록된 자료를 이리저리 파헤치고 인사이트를 발굴하지만, 어떤 업무든 선배들이 남긴 요령이 있기 마련이다.

 

다만, 그 요령을 배우려고 관련 학문을 뒤적거리면 첫장부터 수학과 통계학이 자리잡고 있어서 엄청난 입장료를 지불하게 만들거나 진입을 포기하게 만든다.

 

그래서 이 글에서는 직장인에게 필요한 데이터 분석의 핵심 요령만 정말 간단하게 소개해보고자 한다.


드릴다운(Drill down)

 

Drill은 구멍을 뚧는 도구 또는 반복 훈련을 의미하는 단어이며 Down은 아래로를 의미한다. 자꾸 단어에 대한 의미를 말하는 것 같지만, 지루한 데이터 분석 작업을 포기하고 싶을 때마다 꼭 떠올렸으면 하는 단어이기 때문이다.

 

드릴다운의 사전적 의미도 어찌보면 분석(分析)과 비슷해보이지만, 드릴다운이란 작업은 단순히 나누거나 쪼개는 밋밋한 의미가 아닌 데이터를 바닥까지 드릴처럼 뚤고 내려가는 역동적인 작업을 의미한다.

 

MSTR, Tableau(태블로)와 같은 데이터 요약/분석 툴에서는 엑셀의 피벗테이블과 유사한 분석환경을 제공하는데, 해당 툴의 메뉴얼에서도 꼭 빼놓지 않고 설명하는 작업은 드릴다운이다.

 


 

엑셀 피벗테이블로 드릴다운 해보자

 

드릴다운의 방법과 요령에 대해서는 예제와 함께 바로 알아보자. 공공데이터포털에서 서울교통공사 지하역사 공기질 측정정보라는 데이터를 가져와 봤다.

 

데이터는 호선과 역명을 기준으로 미세먼지, 초미세먼지 등의 공기질 측정 수치와 기준일자가 포함되어있다.

 

데이터 예시

 

삽입 메뉴의 피벗테이블을 누르면 아래와 같은 화면이 나온다.

 

엑셀 Pivot테이블 화면 구성

 

피벗테이블은 자동으로 인식된 피벗 테이블 필드를 열과 행에 드래그하기만 하면 자동으로 데이터를 요약해주는 툴로 복잡해 보이는 BI툴 들도 모두 동일한 화면으로 구성되어있다.

 

그럼 첫번째 작업으로 필드에서 노선을 행필드에 드래그하고 값 부분에 자동으로 생성된 합계의 ▼(화살표)부분을 눌러 평균으로 바꿔주자.

 

 

 

1호선의 미세먼지는 72.6으로 다른 노선에 비해 2배 가량 높게 나오는 걸 볼 수 있다. 오래된 노선일 수록 공기가 안 좋아 보이긴 하는 데 아무리 그래도 1, 2호선의 차이는 너무 하지 않는가?

 

호선별 미세먼지

 

왜 그런지 살펴보기 위해 각 호선 밑에 역명을 추가하여 노선별 역별 미세먼저를 살펴보자.

 

피벗테이블 메뉴에서 행부분에 역 필드를 드래그하면 되는데, 이렇게 특정 개체나 군집을 더 자세히 들여다보기 위해 데이터를 추가하여 파내려가는 행동을 드릴다운이라고 한다.

 

드릴다운된 데이터에서 노선별 미세먼지를 정렬해보면 1호선은 서울역과 동묘를 제외한 모든 역에 미세먼지가 많다. 오히려 서울역과 동묘가 평균을 그나마 낮춰준 느낌이다.

 

 

 

서울역은 대형역사에 최근 공사를 새로했으니 깨끗한 게 짐작은 가는데 동묘역은 왜 깨끗할까? 확인해보니 동묘역도 다른 지하철과 환승을 위해 가장 최근인 2005년에 개통된 역이라고 한다.

 

다른 노선에서도 이러한 특징을 살펴볼 수 있었는데 당초 예상했던 대로 오래된 노선일 수록 미세먼지가 많은 것은 맞지만, 노선보다는 지하역사가 오래될 수록 공기질이 안좋은 것으로 확인되었다.

 


 

1번의 드릴다운 밖에 하지 않은 간단한 예시를 살펴봤지만, 실무에서는 처음보는 막막한 데이터라도 여러 차례 파내려 가다보면 결국 인사이트를 발견할 수 있을 것이다.

 

 

※ 참고사항

엑셀 2013이상의 버전에서는 피벗테이블에 드릴 다운과 드릴 업이라는 버튼을 볼 수 있다. 해당 기능은 비슷한 목적을 가졌지만 엑셀에서 붙여둔 이름일 뿐 이 기능을 통해서만 드릴 다운을 쓸 수 있는 것은 아니다. 또한 이 기능은 파워 피벗에서 계층 구조를 가진 데이터를 입력해야만 동작하기 때문에 대부분은 비활성화 상태로 표시된다.

 

 

 

드릴다운_지하철역사공기질.xlsx
0.05MB

 


728x90