쉽게 쓴 데이터·AI 지식/AI 15

FDS(이상 거래 탐지 시스템)의 동작 방식과 한계

FDS 정의 및 동작 방식 FDS(Fraud Detection System)는 전자금융거래 시 단말기 정보와 접속 정보, 거래 정보 등을 수집하여 이상 거래를 차단하는 기술을 말한다. FDS 솔루션은 90년대 초 처음 등장하여 고도화된 범죄 방식에 맞춰 꾸준히 고도화되고 있는 분야이다. 기본적으로는 위치정보, 고객정보, 평소 거래 패턴, 접속 환경 등을 이용하여 이상 거래를 탐지한다. 은행, 증권 등은 이상 거래가 탐지되면 진행을 잠시 멈추고 추가인증을 요구한다. 신용카드는 거래중인 거래는 일단 처리해주지만, 문자 등을 통해 고객에게 안내한 후, 확인 되기 전까지 추가 사용을 정지시키기도 한다. FDS의 한계 계좌이체, 카드 승인과 같은 실시간 대량 거래는 정상거래의 과부하 위험 때문에 대부분 Rule방..

GPT4는 GPT3를 8개 합쳤다? 차세대 LLM의 해법이 된 MoE

GPT4는 GPT3 8개로 구성? 조금 지난 떡밥이지만 올해 6월 미국 천재 해커 조지 호츠가 GPT 4는 GPT 3규모의 모델 8개를 엮어서 파라미터가 1조개 인척하는 트릭을 썼다고 주장했다. 물론 이 내용은 오픈AI가 모델에 대한 세부 정보를 공개하지 않아서 공식적인 내용은 아니지만, 당시 여러 전문가들에게 이 가설을 설득력있게 받아들였다. 게다가 얼마 전 오픈AI가 지난해 말부터 GPT5에 해당하는 '아라키스(Arrakis)'라는 모델 개발을 진행했다가 올여름에 폐기했다는 소식이 나오면서 해당 모델에 MoE를 적용했었다는 사실도 함께 알려졌다.(관련 기사) MoE모델이란 MoE는 Mixture of Expert의 약자로 문장 그대로 "전문가의 혼합"을 말한다. LLM에서는 특정 분야의 지식을 집중적..

자연어 검색에 쓰이는 기술과 AI검색엔진

자연어 검색의 태동 게시판에서 제목이나 내용을 선택하고 검색하는 기능은 데이터베이스에서 특정한 단어가 포함되었는지 여부만 체크하여 조회하는 기능으로 만들어진다. 초창기 검색엔진도 이 기능을 이용하였으며 당시 웹사이트가 그리 많지 않았기 때문에 기술적인 한계는 그다지 문제가 되지 않았다. 사실 당시 검색엔진의 역할은 도메인을 일일이 타이핑하지 않게 해주는 역할이 대부분이었기 때문에 재밌게도 야후의 주요 검색어는 "구글", 그리고 구글의 주요 검색어는 "야후"였을 정도이다. 인터넷이 활성화되면서 새로운 사이트가 많이 생겨났고, 특히 게시판과 커뮤니티, 카페 등이 활성화되면서 사람들은 점점 사이트가 아닌 정보를 찾기 시작하였다. 웹사이트에 포함된 컨텐츠, 특히 게시판 등에 포함된 정보를 통합 검색하기 시작하면..

인간처럼 학습하는 AI로 가기 위한 멀티모달 기술

범용인공지능의 목표 범용인공지능(Artificial General Intelligence)이라는 영역이 있다. 통칭 AGI라고 부르는 General AI는 정해진 역할만 수행하는 이미지, 음성, 챗봇 등과 달리 다양한 기능을 수행하면서 스스로 학습하고 발전해나가는 AI를 목표로 한다. 올해 5월에 구글 AI 조직이 개편되면서 사임한 제프리 힌튼교수는 딥러닝에 역전파라는 개념을 도입한 AI의 대부라고 불리던 사람이었다. 그런 그가 구글을 떠나면서 남긴 말이 'AI가 핵보다 위험하다' 였으며, 75세의 노교수가 무엇을 두려워하는지는 모르겠지만, 현재의 추세대로라면 AGI가 5~20년이내에 완성될 것이라며 규제해야한다고 주장하였다. 인간의 센싱능력 센싱(감지)이랑 센서(감각)에 이해 입력된 데이터를 정보로 전..

OCR(광학 문자 인식)기술은 어떻게 발달하고 있을까?

생활 속에서 널리 쓰이는 OCR 최신 스마트폰은 카메라를 켜고 글자가 있는 곳에 가져가면 문서 모양 아이콘 [=] 이 나타나면서 글자를 자동으로 인식한다. 별도 앱을 활용해서 명함과 문서를 찍으면 글자 부분만 인식해 자동으로 등록해주기도하고, 자동차 주행거리를 찍으면 보험사앱에서 주행거리를 자동으로 인식하여 보험료를 할인해주기도 한다. 예전에는 프린터기 구매 시 번들로 제공되거나 유료로만 구할 수 있었으나 성능마저 형편없었던 문자인식 프로그램이 어떻게 이렇게까지 자연스럽게 녹아들 수 있었을까? OCR기술의 구조 OCR기술은 생각보다 오래되었다. 지금으로부터 무려 100여년 전인 1928년에 오스트리아에서 포토 센서를 활용한 패턴 매칭 기반 Reading Machine을 만들었으며, 이를 최초의 OCR기기..

이미지 3장으로 알아보는 AI학습(가중치와 편향)

AI학습에는 엄청난 리소스가 발생한다. AI를 사용할 때는 리소스가 많이 들지 않지만 AI를 학습시킬 때는 모델의 크기에 따라 리소스도 많아진다. 챗GPT를 만든 오픈AI도 학습 비용을 감당하기 어려워지자 마이크로소프트와 협업하기 시작했고, 구글은 바드를 가르치기 위해 자사 클라우드를 외부에 임대하지 않고 AI학습에 투입해야만 했다. AI는 왜 학습할 때 엄청난 리소스를 필요로 할까? 결론만 간단히 말하자면 "학습할 때 연산을 많이 하기 때문"이다. 하지만, 기업에서 AI를 도입할 때 또는 챗GPT를 둘러싼 기업의 경쟁을 지켜볼 때 자주 언급되는 사전학습과 추가 학습, 그리고 프롬프트에 대해 궁금하다면, 최대한 쉽고 자세하게 설명하기위해 준비한 아래 3장의 이미지를 봐주기 바란다. ※ 준비한 이미지는 원..

AI 추가 학습의 종류와 리소스(Fine-Tuning, Prefix tuning, LoRa)

초거대AI의 파라미터 GPT와 같은 초거대 AI는 데이터를 학습하면서 AI를 구성하는 최소 단위의 모델 "퍼셉트론"의 계산 결과를 연결해주는 엄청난 양의 파라미터를 가지고 있다. 인간의 뇌는 뉴런이 처리한 정보를 시냅스가 전달하고 집적된 신호를 바탕으로 판단을 내리는 데, AI 또한 퍼셉트론(인공 뉴런)이 정보를 처리하면 파라미터(시냅스 역할)가 이를 전달하여 최종 예측을 진행한다. 인간이 성장할 수록 시냅스를 늘려나가듯이 초거대 AI도 데이터와 처리량이 많아지면서 파라미터를 지속 확대해 왔는데, GPT 4를 기준으로는 전작에 비해 6배에 달하는 1조 개까지 도달하였다. 다만, 기존 AI의 파라미터에 비해 많을 뿐 인간의 시냅스(성인 기준 100조 개)에 비하면 아직 부족하다는 의견도 있으며, AI의 성..

음성 합성 기술 - TTS(Text To Speech, 텍스트의 음성 전환)

TTS의 정의와 적용 현황 음성 합성(Speech synthesis 또는 Text To Speech) 기술이란 인간의 말소리를 합성하는 기술로서 텍스트를 입력하면 음성의 발음, 속도, 호흡, 운율 등을 추정하여 녹음해둔 음성을 조합하거나 생성하는 기술이다. 1930년대 텍스트를 입력하면 이에 맞춰 피아노를 동작시키는 아이디어에서 시작하여 80년대부터 본격적으로 상용화되었으며 90년대에 이르러서는 음성 인식(STT, Speech To Text)과 더불어 활용도가 넓어지기 시작하였다. 초기에는 시각장애인을 위한 기술 위주로 시작하였으나 상용화되면서 안내 음성, ARS 등 기계음의 영역에서 이용되었으며, 현재는 AI를 기반으로 자연스러운 음성을 만들어짐에 따라 오디오북, 게임, AI앵커 등과 같은 성우의 역할..

음성 인식 기술 - STT(Speech To Text, 음성의 텍스트 전환)

음성인식의 발전 과정 음성인식은 Speech Recognition 또는 STT(Speech To Text)으로 불리며, 인간의 육성을 인지하여 문자로 전환(기록)하는 기술을 말한다. 음성을 텍스트로 전환해주는 기술은 1950년대부터 숫자를 인지하는 것부터 시작하여 단어와 문장을 구분하는 형태로 발전하였으나 정체기에 있다가 AI를 활용한 예측기술이 도입되고 2010년 구글에서 Voice Speech를 발표하면서 각광받기 시작하였다. 구글과 애플은 기본적으로 음성입력장치가 부착되어있고 상시적으로 네트워크가 연결된 스마트폰을 통해 사용자들의 막대한 데이터를 수집하였으며 개인별로 다른 억양과 말투, 습관 등을 학습할 수 있었다. STT를 기반으로 한 음성 명령 체계는 TTS(Text to speech, 음성합성..

AI학습의 장애물, 암묵적 지식에 대한 정의와 해결 방법

1. 정의 암묵적 지식(Tacit Knowledge)이란 문자나 언어로 표현하기 어려운 지식으로, 명시적 지식(Explicit Knowledge)과 상반된 개념이다. 특정 분야의 전문가들이 가지고 있는 통찰력이나 상황 대처에 대한 능력은 오랜 시간 동안 서서히 체득되어 타인에게 전달하기 어려운 경우가 많은데, 이러한 경우 보통 암묵적인 지식이 많이 포함되어있다. 또한, 자전거를 탈 때 '한쪽으로 치우치지 않게 균형을 잡아야 한다'와 같이 명시적으로는 서술할 수 있지만, 제대로 전달하기 어려운 경우 암묵적인 지식으로 분류할 수 있다. 암묵적 지식은 가지고 있는 당사자도 스스로 인지하지 못하거나 쓸모 없다고 생각하는 경우도 많은 데, 흔히 상식이라 생각하는 단편적 지식이나 문화에 따라 형성된 자연스러운 행동..

반응형