전체 글 108

FDS(이상 거래 탐지 시스템)의 동작 방식과 한계

FDS 정의 및 동작 방식 FDS(Fraud Detection System)는 전자금융거래 시 단말기 정보와 접속 정보, 거래 정보 등을 수집하여 이상 거래를 차단하는 기술을 말한다. FDS 솔루션은 90년대 초 처음 등장하여 고도화된 범죄 방식에 맞춰 꾸준히 고도화되고 있는 분야이다. 기본적으로는 위치정보, 고객정보, 평소 거래 패턴, 접속 환경 등을 이용하여 이상 거래를 탐지한다. 은행, 증권 등은 이상 거래가 탐지되면 진행을 잠시 멈추고 추가인증을 요구한다. 신용카드는 거래중인 거래는 일단 처리해주지만, 문자 등을 통해 고객에게 안내한 후, 확인 되기 전까지 추가 사용을 정지시키기도 한다. FDS의 한계 계좌이체, 카드 승인과 같은 실시간 대량 거래는 정상거래의 과부하 위험 때문에 대부분 Rule방..

비식별 데이터의 정의와 결합, 활용 방법

비식별 데이터 정의 비식별 데이터는 개인정보를 삭제하거나 식별할 수 없도록 처리한 데이터를 말한다. 비식별 처리에는 가명처리와 익명처리가 있으며 가명처리는 이름을 숫자로 대체하거나 주민번호를 암호화하여 개인을 알아볼 수 없도록 하는 것이며, 익명처리는 개인정보를 완전 삭제하는 것이다. 가명처리된 데이터는 연령, 지역 등의 정보가 남아있어서 익명처리 데이터보다 활용범위가 넓다. 비식별 처리된 데이터는 외부에 제공하거나 데이터거래소를 통해서 판매할 수 있으며, 당연히 구매도 할 수 있다. 비식별 처리는 별도의 솔루션을 도입할 수 있다. 비식별 데이터 결합 및 활용 외부데이터는 전문기관을 통해서 자사데이터와 결합할 수 있다. 단, 결합 후 비식별처리된 데이터를 받게된다. 전문기관은 데이터전문기관과 결합전문기관..

BI(비즈니스 인텔리전스)와 기업 데이터 활용

BI(Business Inteligence) 정의 Business Intelligence(BI)는 기업의 데이터를 수집, 분석, 공유, 모니터링하여 조직의 의사 결정을 지원하는 프로세스와 기술을 말한다. BI를 구축하기 위해서는 우선 재무, 영업, 고객, 운영 등의 기업 내 다양한 데이터를 표준화해야 한다. 그리고 의사결정을 위해 투입(Input), 과정(Process), 산출(Output), 결과(Outcome)로 나눠지는 경영지표를 생성해야 한다. 마지막으로 이러한 데이터와 지표를 활용하여 의사결정을 위한 분석 및 보고서를 작성한다. 데이터를 준비하기 위해서는 각 업무를 담당하고 있는 현업부서의 참여가 꼭 필요하지만, 업무가 체계화되어 있지 않거나 지표에 대한 합의가 이루어지지 않을 경우 BI 자체가..

공공데이터 조회 및 활용 방법

공공데이터 란공공데이터는 공공기관이 보유한 데이터로 소관부서는 행정안전부이다. 공공데이터법(국가법령정보센터 공공데이터법)과 시행령에 의해 관리되며 시행령에는 데이터 표준과 품질 등의 관리방법과 요청 등의 내용이 나와있으며 공공기관은 이를 따라야한다. 공공데이터는 시행령에 따라 공공데이터포털(https://www.data.go.kr/)에서 검색할 수 있으며 파일 또는 API로 제공된다. 공공데이터 활용TIP23년 5/25일 현재 공공데이터는 파일 58,398건, API 10,844건, 표준데이터셋 9,350건이다. 공공데이터포털에는 활용 및 우수사례 등이 게시되어 있으며, 경진대회도 꾸준히 개최되고 있다. ☞ 공공데이터 기업 매칭 지원사업 개방 데이터 활용 사례집 ☞ 당신을 이롭게 세상을 새롭게 만드는 공..

코호트 분석의 정의와 이론적 배경

코호트 정의 코호트는 로마 군대의 세부 조직에서 유래된 말로 같은 공간에서 훈련을 받아서 비슷한 성향을 가지게 된 것에서 유래되었다. 통계학에서는 "공통적인 특성을 가진 사람들의 집단"을 뜻하며, 오랜 시간 추적조사를 통해 출생코호트 등에서 유사한 행동을 하는 것을 연구하였다. 사회학에서는 "같은 시기를 살아가면서 특정한 사건을 함께 겪은 사람들의 집합"을 일컫는다. 코호트 활용 목적 코호트 분석의 목적은 동일한 세대, 입학, 경제 상황, 사건 등과 같은 공통 조건 또는 경험을 가진 사람들의 집단 간의 비교를 통해 시간에 따른 패턴, 트렌드, 행동 변화를 분석하는 것이다. 코호트 분석은 비슷한 시작점을 가지고 있는 여러 그룹 간의 비교 통해 발생하는 변화를 파악할 수 있다. 예를 들어 같은 연도에 동일한..

경량화 언어모델(sLLM)에 대한 오해와 온디바이스AI

경량화 언어모델(sLLM)의 활용방법 CES에 온디바이스 AI제품이 대거 출시되면서 경량화LLM에 대한 관심이 다시금 올라가고 있다. 작년만해도 초거대AI로 만들어진 챗GPT가 엄청난 성능을 선보이면서 sLM은 성능이 떨어지지만, 고가의 학습 비용때문에 어쩔 수 없이 사용하는 저가형 모델로 인식되었는데, 온디바이스 AI로 활용가치가 높아진 것이다. 이는 마치 스마트폰이 활성화되기 전 안드로이드OS가 리눅스 열화판으로 인식된 것처럼 소프트웨어가 하드웨어보다 빠르게 발전되면서 발생한 현상으로, 앞으로는 AI도 OS와 마찬가지로 용도에 따라 다양한 버전이 운용될 것으로 보인다. 또한, MS가 윈도우에 AI코파일럿을 탑재하면서 OS에서 앞서나가려 했던 시도는 iOS/안드로이드에도 영향을 끼칠텐데, 최근 삼성전자..

넷플릭스가 데이터를 사용하는 방법을 천천히 알아보자 ④성과 분석

목표를 위한 측정과 개선을 위한 측정 기업의 성과 측정으로 많이 사용되는 KPI(Key Performance Indicator, 핵심성과지표)는 원래 투입 → 활동 → 산출 → 결과로 구분된 단계별 목표 달성을 위한 지표 관리 방법이지만, 현실에서는 부서별로 매출을 할당한 후 목표를 채근하기 위한 수단으로 사용되고 있다. 애초에 임원들 요구에 맞춰 도입된게 왜곡의 원인이지만, 한때 유행했던 마이크로 매니지먼트(Micromanagement, 세부업무 및 의사결정에 직접 관여하는 방식)와 결합하여 엄청난 시너지를 일으켰으며, 여전히 이 방식을 유용하게 생각하는 사람들이 꽤 있다. 각자의 환경에 맞는 방식이 있을테니 정답을 말하기는 어렵지만, 넷플릭스의 성과분석 방식은 목표 달성보다는 진단과 개선을 위한 KP..

데이터 전쟁 2024.01.05

넷플릭스가 데이터를 사용하는 방법을 천천히 알아보자 ③데이터 수집

데이터가 없다는 기업들 기업의 데이터 분석을 하다보면 데이터가 없다는 불평을 자주 듣는다. 그리곤 경쟁업체나 플랫폼기업을 예시로 들며 고객이 많고 비즈니스 영역이 넓어서 데이터가 풍부한데 우리는 그러지 못하니 한계가 있다고 한다. 결론만 예기하면, 데이터에 대해 제대로 파악 하지 못한 틀린 말이다! 기업에 데이터가 없는 이유는 그저 시도하지 않았거나 요령이 부족하기 때문이다. 데이터는 보통 수집/분석/활용 단계를 거치며 플랫폼기업들은 수집을 효율화하기 위해 엄청난 공을 들인다. 특히, 고객이 없는 초창기에는 상품과 컨텐츠에서 여러가지 형태의 라벨(데이터)을 붙인 후 다양한 구성으로 고객에게 제공하는데, 라벨링된 상품이 고객에게 제공되면 판매가 진행되면서 고객 반응이 다시 상품정보로 반영되어 눈덩이가 커지..

데이터 전쟁 2023.12.29

구글 제미나이보다 믹스트랄(Mixtral 8x7B)에 주목해야 하는 이유

제미나이는 의미있는 시도, 그러나 단기적으론 악재 구글 제미나이는 멀티모달 AI의 비전을 제시했다는 부분에서 큰 의미가 있다. 특히 조작된 영상으로 판명나긴 했지만, 영상과 음성정보를 매끄럽게 연동하고, 경량화버전을 픽셀에 탑재했다는 건 카메라를 포함한 각종 센서를 가진 스마트폰에서 안드로이드를 쥐고 있는 구글이 어떤 변화를 줄지 상당히 기대된다. 하지만, 조작된 영상과 울트라 미 발표(환각현상), 그리고 지쳐있는 데이비드 하사비스의 모습까지 겹치다보니 구글이 조급한 마음에 뭔가 삐걱거리고 있는 건 아닐까라는 의구심이 든다. 그리고 이는 단기적으로 기업부문에서 악재로 동작할 것 같다. 일전에 포스트(바로가기)에서 언급한대로 생성형 AI는 생산성에 영향을 미치기 때문에 기업은 예산이 편성된 내년부터 분주하..

24년 AI전망 총집합(가트너, 엔비디아, SAS 등)

10월부터 컨설팅과 IT, 그리고 데이터 기업에서 24년 전망을 내놓았다. 엔비디아를 마지막으로 AI관련 핵심 기업들의 의견을 수집되어, 이를 모아 한꺼번에 정리해보고자 한다. AI로 인한 IT지출 8%증가예상 IT관련 전망을 잘 맞추고 실제 영향력도 구사하는 가트너에서 24년 전세계 IT투자금액이 8%증가할 것으로 예상하고 있다. 실제로 관련 기업들의 주가가 요동치면서 자금이 유입되는 양상을 보이고, 최근 발표된 구글 제미나이만 봐도 크기별 LLM과 클라우드를 포함한 구체적인 B2B AI솔루션을 제시하고 있으니, 기업들의 선택지가 다양해져 실제 투자로 이어질 것이다. 특히, 생성형AI는 빅데이터붐과는 달리 업무 효용성과 인건비 절감과 같은 구체적인 효과로 연결되기 때문에 기업의 경쟁력과 직결되기 때문에..

반응형