데이터는 개체의 모든 활동을 기록해둔 아카이브이자 자신을 스스로 되돌아볼 수 있는 일기장 같은 역할을 한다.
통계학자와 컴퓨터공학자들은 아카이브를 체계적으로 관리하는 방법을 오랜 시간 동안 연구해왔으며, 일기장을 들춰 새로운 사실을 도출하거나 판단하는 방법도 제시해왔다.
[ 데이터의 활용 주체와 주요 활용 방법의 변화 ]
구분 | 활용처 | 주요 활용 방법 |
3차 산업혁명 초기 (PC) |
기업 | [수집]DBMS기반 업무용 데이터 수집 [요약]실적 보고서 등 장표 작성 [추론]내부 데이터 기반 인사이트 도출 [예측]마케팅, 신용평가 모델 개발 |
3차 산업혁명 중기 (인터넷) |
소비자 | [수집]웹/앱에서 주문 및 게시글 작성 [요약]시각화된 정보 활용 [추론]공개 데이터 기반 인사이트 도출 [예측]개인화된 서비스 이용 |
4차 산업혁명 (AI) |
AI | [수집]내/외부 데이터 수집 [요약]AI 학습용 데이터 가공 [추론]인간과 유사한 학습 체계 구축 [예측]AI 알고리즘 개발 |
어떠한 이유로든 한번 기록된 데이터는 활용 주체에 따라서 ‘정보’로 이용되거나 ‘지식과 경험’으로 쓰인다.
텔레마케팅을 위한 연락처부터 가장 저렴하게 판매하는 쇼핑몰 주소까지 개인과 기업은 끊임없이 최신 정보를 소모하며 책과 문서의 형태로 남겨진 데이터로 지식을 쌓고 다양한 상황을 기록해둔 데이터를 AI의 경험으로 활용하기도 한다.
관리 방법이 체계화되고 활용 방법과 주체가 다양해지면서 활용 가치가 높거나 구하기 어려울수록 더 많은 투자가 이루어졌으며 과거에는 기록과 판매가 어려웠던 데이터까지 실시간으로 수집되고 새로운 부가가치를 형성하고 있다.
실제로 과거엔 매장 직원과 영업 사원만 확보할 수 있었던 소비자의 취향 정보가 이제는 온라인 쇼핑몰뿐만 아니라 포털사이트, 소셜서비스까지 이용자가 남긴 각종 흔적을 추적하여 자사의 비즈니스를 운영하고 판매하기 위한 수단으로 활용되고 있다.
플랫폼의 데이터 수집 방식
IT산업과 AI의 발달에 따라 사용자가 남긴 흔적까지 유용한 데이터로 활용되기 시작하면서 데이터의 가치가 확대되었으며 기업들은 더 많은 데이터를 수집하기 위해 노력하였고 가장 효과적인 수단으로 플랫폼을 꼽고 있다.
자사의 상품만 취급하면서 얻을 수 있었던 것에 비해 훨씬 많은 상품과 서비스에 대한 데이터를 수집할 수 있으며 사용자로부터 각종 정보와 흔적까지 모을 수 있기 때문이다.
대다수의 플랫폼 기업들은 사용자를 늘리기 위해 무료 서비스를 제공하면서 소비자를 모으고 저렴한 수수료를 미끼로 판매자를 유인하고 있다. 그리고 상품과 서비스를 중개하면서 발생하는 데이터를 수집하고 다시 제공하면서 데이터를 순환시키고 있다.
플랫폼에 모이는 데이터는 이러한 특징으로 인해 단일 상품을 제공하는 기업에 비해 훨씬 다양하고 풍부한 데이터를 모으면서 최신화되는 장점까지 가지게 되었다.
그리고 이러한 고품질 데이터가 기업과 소비자를 만족시키고 AI의 품질까지 향상되자 더 많은 사용자가 모이게 되고 결국 플랫폼이 데이터를 독점하는 현상까지 발생하게 되었다.
플랫폼 형태별 데이터 체계
수많은 기업이 플랫폼을 표방하고 이미 다양한 형태의 플랫폼들이 존재하지만 정작 데이터는 수집되지 않는 경우도 다수 존재한다. 특히 플랫폼을 시작하였으나 아직 그에 걸맞은 전산시스템이 구축되지 않았거나 최소한의 정보만 주고받는 경우라면 다양한 데이터를 모이고 순환시키기는 어렵다.
데이터를 확보한다는 관점에서 가장 이상적인 형태이고 연관 플랫폼 간의 이동까지 발생함으로써 가장 큰 네트워크 효과를 노릴 수 있다. 그러나 업종이 다양한 만큼 구조가 다른 데이터를 활용할 수 있는 체계가 마련되어야 하며, 단순히 플랫폼만 연결된 형태라면 별도의 데이터 송수신 인프라를 갖춰야 한다.
'기업의 데이터 분석' 카테고리의 다른 글
4.4. 기업이 AI를 만들고 활용하는 방법 (1) | 2023.05.30 |
---|---|
4.3. 추천과 개인화, 그리고 타겟마케팅 (1) | 2023.05.29 |
4.2. 데이터 기반 의사 결정과 효과 측정 (3) | 2023.05.28 |
4.1. 기업의 데이터 활용 프로세스 (0) | 2023.05.27 |
3.4. 엑셀 기반 데이터 유사도와 협업 필터링 (2) | 2023.05.25 |