전산화된 업무 환경에서 정형 데이터는 입력과 동시에 수집되며 별도의 가공처리 없이 활용할 수 있지만, 비정형 데이터를 추가로 활용하려면 데이터의 형태에 따라 별도의 수집 및 가공 과정이 필요하다.
그리고 목적에 맞는 알고리즘을 선택하여 데이터를 분석해야만 비로소 활용할 수 있다.
기업의 규모가 커질수록 이러한 처리를 위해서는 단계별로 시스템을 구축하고 역할별로 업무를 분담할 필요가 있는데, 기업에서 데이터를 이용하는데 필요한 단계별 업무와 시스템을 알아보자.
기업이 데이터를 활용하는 단계는 아래와 같이 4단계로 나뉘진다.
단계 | 단계별 업무 |
수집 | 기업 내/외부에 보관된 데이터를 조사하고 이용할 수 있도록 관리하는 단계 |
가공 | 형태가 다른 데이터를 활용하기 쉽게 변환하거나 동일한 규칙으로 가공하는 단계 |
분석 | 활용 목적에 따라서 데이터를 요약하거나 모델을 개발하는 단계 |
활용 | 분석한 결과를 의사결정, 마케팅 및 서비스, 자동화 등에 활용 단계 |
1단계. 데이터 수집
데이터를 수집한다는 것은 보통 전산화된 시스템별로 분산된 데이터를 분석할 수 있도록 한곳에 모으거나 연결하는 것을 의미한다. 물론, 현대화된 기업은 비즈니스를 시작할 때 전산화된 시스템과 DBMS부터 구축하고, 업무 환경 또한 DBMS에 최적화되어 있다.
그래서, 자주 사용하거나 유용한 데이터는 현장에서 즉시 입력하고 대부분 DBMS에 저장되어 있지만, 기업이 업무에서 사용하는 데이터가 모두 전산화된 시스템에만 존재하는 것은 아니다.
전산화되어 있지 않아도 ‘흔적’이라는 측면에서 접근하면 상당 부분의 데이터가 여러 곳에 존재한다. 비즈니스를 운영하면서 남긴 문서들과 고객들에게 받은 신청서, 그리고 영업점과 고객센터에 남아있는 메모와 녹취록까지 형태는 제각각이지만, 나름의 형식과 규칙에 따라 남겨둔 기록들은 업무 프로세스 내에서 활용되고 분산되어 있다.
2단계. 데이터 가공
발생 즉시 전산처리 시스템에 입력되지 않고 기록의 형태로만 남아있는 이미지/음성/영상데이터는 필요한 정보를 추출하려면 수작업으로 정보를 확인해야 해서 사용하기 어렵지만, AI 기술을 이용하면 사용하기 쉬운 형태로 전환하거나 필요한 정보만 손쉽게 추출할 수 있다.
STT와 OCR을 이용하여 음성이나 이미지를 텍스트로 전환해두면 일일이 들어보거나 눈으로 확인하지 않아도 특정 단어를 검색할 수 있으며, 이미지와 영상 AI를 사용하면 필요한 정보만 추출하거나 데이터를 쉽게 탐색할 수 있도록 분류해둘 수도 있다.
3단계. 데이터 분석
아래는 기업에서 대용량 데이터를 분석하거나 협업을 목적으로 공유하기 위해 활용하는 솔루션으로 클라우드를 기반으로 데이터를 저장하고 분석하는 서비스도 확산되고 있다.
구분 | 설명 | 활용 예시 |
BI (Business Intelligence) |
데이터를 요약하거나 시각화하는 툴 | MSTR, Tableau |
스프레드시트 | 데이터를 정형화하여 저장하고 수식 및 부가 기능을 통해 요약 및 분석 |
MS 엑셀, 구글 스프레드시트 |
데이터 분석 솔루션 |
데이터 분석 및 모델 개발을 목적으로 유료로 판매되는 전문 분석툴 |
SAS, SPSS |
오픈소스 분석 라이브러리 |
프로그래밍 언어로 데이터 분석 및 모델 개발에 활용 가능한 기능들이 오픈소스로 공유 |
Python, R |
클라우드 기반 분석 서비스 |
아마존, 구글 등의 IT 기업에서 온라인으로 데이터 저장 공간과 가공 및 분석 서비스를 제공 |
AWS, GCP |
4단계. 데이터 활용
기업에서 굳이 이렇게 어려운 과정을 거쳐서 데이터를 분석하고 활용하려는 이유는 다양하겠지만 다음 포스트부터 ‘의사결정과 효과 측정’, ‘마케팅 및 고객 편의’, ‘AI 개발’이라는 3가지 관점으로 설명을 이어가고자 한다.
'기업의 데이터 분석' 카테고리의 다른 글
4.3. 추천과 개인화, 그리고 타겟마케팅 (1) | 2023.05.29 |
---|---|
4.2. 데이터 기반 의사 결정과 효과 측정 (3) | 2023.05.28 |
3.4. 엑셀 기반 데이터 유사도와 협업 필터링 (2) | 2023.05.25 |
3.3. 엑셀 예측모델 데이터 준비와 개발 방법 (7) | 2023.05.25 |
3.2. 데이터로 연관성을 해석하는 방법(엑셀 상관분석) (1) | 2023.05.25 |