기업의 데이터 분석

1.3. 데이터로 할 수 있는 업무 영역

정데만 2023. 5. 16. 12:49
728x90
 

기록이든 흔적이든 기업의 여러 장소에서 수집된 데이터를 다시 여러 부서가 사용하게 하려면 데이터를 어떻게 활용할지 계획을 수립하고 이에 걸맞는 시스템이나 인력 등을 준비해야한다.
 
다른 기업의 사례를 참조하는 것도 좋지만, 자사에 업무환경에 맞춰 시스템을 구비하기 위해서는 데이터 활용 업무 영역에 대해서 본질적인 목적을 정리 해보는 것도 좋은 방법이다.

 

데이터가 사용되는 모든 장소를 통틀어서 데이터를 이용하는 최종 목적은 ‘요약’, ‘추론’, ‘예측’ 3가지이다. 보고서를 작성하든 마케팅에 활용하든 데이터는 해당 업무에서 3가지 역할을 하게 된다.


1. 데이터를 활용한 ‘요약’

조선시대에 있었던 사례를 보며 ‘요약’의 의미를 짚어보자. 정조는 아버지 사도세자의 묘소인 현륭원 식목 사업을 마무리 짓고 논공행상을 위해 신하들에게 물었다.

 

“지난 7년간 인근 8개 고을에서 나무를 심어 논공행상하려고 한다. 심은 나무가 모두 몇 그루냐? 어느 고을이 나무를 가장 많이 심었는가?” 하지만 아무도 대답을 못 하였고 관련 서류를 실어 오게 하니 나무를 심을 때마다 쌓인 공문으로 소가 끄는 수레 하나에 차고도 넘쳤다고 한다.

이에 정조는 정약용에게 정리를 지시했으며 정약용은 이에 따라서 먼저, 고을별로 공문을 분류한 후 날짜순으로 묶어 세로 칸은 날짜를 적고, 가로 칸은 나무 종류를 적어 고을별로 여덟 장의 데이터를 만들었다.

 

그리고 새로운 종이에 세로 칸은 연도를 적고, 가로 칸은 고을 이름을 적어 수레 한 대분의 공문서를 한 장의 표로 요약하였다. 정조는 이를 보고 “책 한 권 이내로 하라 했더니 종이 한 장으로 정리했구나.”라고 말한 후 작성된 표에 따라 논공행상했다고 한다. 
 
이처럼 데이터에 있어서 ‘요약’이라 함은 의사결정이나 판단을 위해 여러 개의 데이터에서 핵심적인 내용을 간추리거나 함축적으로 구성하는 업무를 말한다. 현대에 있어서 요약은 BI와 인포그래픽분야로 발달하였으며 다양한 통계적 기법이 활용되고 있다.

 

목민심서에 있는 침기부종횡표 남당리 예시

 

2. ‘예측’의 의미와 활용

데이터를 활용한 ‘예측’은 다양한 활용 분야가 있고 기술이 발달하여 있음에도 불구하고 대중적으로는 미래의 일을 점지하는 ‘예지’의 영역으로 치부되거나 정확도를 가혹하게 검증받는 경우가 많다. 
 
예측이라는 단어 자체가 가지는 기대심리와 일부 분야에서 과도하게 부풀려져서 발생한 오해로 비롯된 것인데, 실제 미래에 발생할 사건 또는 질병 여부와 같이 현 시간에 확인하기 어려운 수치에 대해서 데이터를 기반으로 확률적으로 가능성을 계산하는 것은 인간의 의사결정 작동원리와 유사하며, AI를 학습시키는 방법으로도 활용된다.

 

 

3. 데이터를 기반으로 한 ‘추론’

추론은 사전적 정의에 따르면 ‘이미 알고 있는 사실이나 명제를 토대로 결론을 끌어내는 사고 과정’을 의미하는 것으로 과거 데이터를 기반으로 미래를 판단하는 것이 목적인 예측과 달리 시점과 무관하게 발생한 사건에 대해 원인이나 모르는 부분을 짐작하는 방식이다. 
 
인간은 일상적인 대화에서도 추론을 많이 한다. 예를 들어 “철수는 아침 일찍 일어나서 학교에 가는 편인데 항상 영희보다 늦게 도착해”라는 대화를 시작하면 영희는 철수보다 학교에서 가깝게 살 것이라고 추론하고 “그럼 영희는 집이 가까운가 보네”라고 대화를 이어 나가는 것이다. 

 

초등학교 6학년 국어 교과서

추론은 ‘예측’보다 더 큰 논쟁에 휘말리는 분야이다. 우선 한정된 데이터로 진행되기 때문에 다양한 추측이 발생할 수 있다. 앞선 예시를 다시 살펴본다면 기상 시간을 근거로 철수는 영희보다 먼 곳에 살 수도 있지만 실제로는 영희가 자전거를 이용해서 더 빠르게 등교할 수도 있는 것이다.
 
또한 데이터가 충분하지 않은 상황에서 추론해야 하기 때문인데 예를 들면 신제품에 대한 선호 고객과 같이 아직 발생하지 않은 사건에 대해서 기존 데이터만 이용하여 논리적으로 풀어내야 하는 맹점이 있다. 그래서 데이터에 기반을 둔 추론은 단순히 데이터 분석 능력뿐 아니라 추론하고자 하는 분야에 대한 지식과 경험이 필요하다.


728x90