기업의 데이터 분석

1.2. 기업의 데이터 수집에 대한 현실적인 지침

정데만 2023. 5. 15. 14:25
728x90
 

업무 환경에서 ‘데이터’란 보통 DBMS에 저장된 데이터베이스를 지칭한다. 데이터베이스를 줄여 부르면서 생긴 단어이기도 하지만, 기업의 핵심 장표와 서류, 그리고 웹사이트의 고객 및 주문정보까지 모두 DBMS에 저장되어 있으니, 단어만 놓고보면 데이터베이스를 떠올리는 건 당연할지도 모른다.

 

 


80년대 전산화가 시작되면서 수기로 관리하던 원장과 장표들은 전산화된 시스템으로 이동하였으며, 캐비넷에 서류를 보관하고 찾던 방식은 DBMS에서 통합 조회하는 방식으로 바뀌었다.
 
전산화로 비롯된 데이터 관리 시스템은 행과 열로 구성된 정형 데이터 체계를 채택하였고, 관리와 집계의 편의성을 위해 규칙을 정한 후 항목과 수치만 간략하게 기록한다. 이 과정에서 데이터시 조금 소실될 수는 있지만, 그동안은 그다지 이슈가 되진 않았다.
 
인터넷의 확산으로 IT비즈니스가 출현하면서, 일반 기업에서도 데이터를 좀 더 많이 사용해야한다는 주장이 제기되었으며, 여러 기업들은 활용처를 떠나 빅데이터를 수집하기 시작하였다.

 

초창기 빅데이터는 인터넷에서 수집한 SNS와 뉴스 등의 여론, 그리고 제휴 등을 통해 확보한 외부데이터가 주류를 이루었으나, AI 기술이 발전하면서 DBMS 정형화 과정에서 소실된 비정형 데이터에 초점이 맞춰졌으며, 각종 시스템의 로그와 문서, 사진, 음성, 동영상 등의 데이터가 수집되고 있다.

 


 

데이터가 발생하는 상황

기술과 시장의 방향성은 제시되고 있으나 어떤 데이터를 수집하고 활용해야하는지 결정하는 건 여전히 쉽지않다. 이 문제에 대해 우선, 데이터가 발생하는 상황에 대해 생각해보자.

데이터는 ‘기록’과 ‘흔적’으로 생성된다. 혹자는 데이터를 마치 DNA처럼 만물의 생성 규칙으로 표현하기도 하지만, 실무에서 그런 정의는 그다지 도움이 되지 않는다.
 
데이터는 본질적으로 어딘가 남겨지는 것이며, 인위적으로 작성하면 ‘기록’, 자연적으로 남겨져 있으면 ‘흔적’이라고 할 수 있다.

 

벽화(기록)와 화석(흔적)

전산시스템의 데이터는 기록이라고 볼 수 있으며, 업무과정에서 발생한 문서, 또는 시스템이 동작하면서 남겨진 로그는 일종의 흔적이라고 볼 수 있다.
 
인터넷쇼핑몰에서 물건을 주문한 정보는 기록이지만,  주문 과정에서 상품을 탐색하거나 키워드를 검색한 이력은 흔적이며, 콜센터 상담일지는 기록이지만, 녹취록은 흔적이고, 고객정보는 기록이지만 가입 신청서는 흔적이다.


데이터 수집 시 유의사항

대다수의 흔적 데이터가 비정형이기 때문에 비정형데이터를 수집해야한다는 말은 얼추 비슷한 흐름으로 볼수 있다. 그러나 아직 저장하지 않고 있지만 어떤 데이터를 남겨야하는지 떠올리고자 한다면, 데이터의 형태보다는 흔적이라는 생성방식에 초점을 맞추는 것이 좋다.

내부 프로세스 중 아직 저장하지 않고 있는 흔적이 있다면 최우선적으로 수집대상에 올린 후 흔적의 최종 목표에 대한 개선에 활용해야 한다.
 
대다수 플랫폼기업들은 고객이 남긴 흔적을 하나라도 더 차지하기 위해서 각종 서비스를 내재화하고 있으며 여기서 쌓인 데이터를 독점하고 있다.

 

아직 플랫폼까지는 고려하지 않고 있는 기업이라 하더라도 흔적 데이터를 활용하는 과정들은 단순한 활용데이터의 확대 뿐 아니라 기업의 프로세스를 탄탄하게 만들어주며 더 나가아서는 플랫폼기업과도 견주어도 충분한 데이터 경쟁력을 갖추는 계기가 될 것이다.

 


728x90