전체 글 108

GPT4.0을 이용한 국내 AI 인터페이스 - 뤼튼(wrtn.ai)

챗GPT, Bard와 같은 대규모 언어 모델(LLM, Large Language Model)은 언어모델이라는 이름에 걸맞게 문장을 생성할 뿐 아니라 프롬프트에 입력한 글을 요약하거나, 문장을 해석하여 화자의 감정이나 행동을 분석하며, 간단한 추론을 하기도 한다. 대규모 언어학습에 의해 만들어진 확률 기반 생성 모델이라고만 하기에는 강력한 기능을 가진 언어모델은 단순히 챗봇으로만 활용되는 것이 아닌 언어에 의해 동작하는 모든 행동을 수행할 수 있다. 이미 챗GPT안에서는 대화를 통해 쇼핑과 여행, 레스토랑 예약과 같은 기능 각종 플러그인이 동작중이며, 마이크로소프트는 GPT4.0을 이용하여 빙챗과 코파일럿을 서비스하면서 GPT를 AI인터페이스에 적용하고 있다. 얼마전 방한했던 오픈AI의 샘 알트만과 그레그..

유용한 TIP 2023.06.12

AI학습의 장애물, 암묵적 지식에 대한 정의와 해결 방법

1. 정의 암묵적 지식(Tacit Knowledge)이란 문자나 언어로 표현하기 어려운 지식으로, 명시적 지식(Explicit Knowledge)과 상반된 개념이다. 특정 분야의 전문가들이 가지고 있는 통찰력이나 상황 대처에 대한 능력은 오랜 시간 동안 서서히 체득되어 타인에게 전달하기 어려운 경우가 많은데, 이러한 경우 보통 암묵적인 지식이 많이 포함되어있다. 또한, 자전거를 탈 때 '한쪽으로 치우치지 않게 균형을 잡아야 한다'와 같이 명시적으로는 서술할 수 있지만, 제대로 전달하기 어려운 경우 암묵적인 지식으로 분류할 수 있다. 암묵적 지식은 가지고 있는 당사자도 스스로 인지하지 못하거나 쓸모 없다고 생각하는 경우도 많은 데, 흔히 상식이라 생각하는 단편적 지식이나 문화에 따라 형성된 자연스러운 행동..

언어모델에 프롬프트 엔지니어링이 필요한 이유

대화의 맥락 변화 인간의 대화는 질문과 답변을 통해 수없이 많은 경로로 이어지며, 대화 도중에 주고 받은 정보를 학습하기도 하면서 맥락을 형성한다. GPT와 같은 언어모델은 이전의 챗봇들과 달리 대화가 이어지더라도 이에 맞는 답변을 하기 때문에 마치 맥락을 이해하는 것처럼 보이지만, 사실 대화를 통째로 학습하여 앞선 문장과 연결된 답변을 생성하는 것이다. 이러한 특성으로 인해 챗GPT와 구글 Bard는 맥락에 맞지 않는 대화를 이어나가면 유사한 데이터를 찾지 못해 엉뚱한 답변을 하거나 환각현상(거짓 답변)을 일으킨다. 대화형AI에서 원하는 답변을 얻기 위해서는 언어모델이 학습한 다양한 텍스트 데이터를 탐색하고 이에 맞는 문장을 생성할 수 있도록 풍부한 키워드가 포함된 맥락적인 프롬프트(질문, 명령)를 입..

코호트, 피어그룹, 페르소나의 차이점과 쉽게 구분하는 방법

세그먼트란 데이터를 분석할 때 고객을 분류하거나 군집화한 후 최소 단위의 그룹을 세그먼트라고 부른다. 세그먼트는 속성이나 행동에 따라 또다른 유사 속성을 가지거나 연결된 행동을 할 가능성이 있으므로, 고객 분석 시 세그먼트를 활용하면 향후 행동에 대한 예측이나 원인에 대한 추정이 가능해진다. 통계학과 사회학에서도 고객을 분류하고 행동을 분석하여 공동 연구를 목적으로 세그먼트를 활용하며, 특성에 따라 코호트, 피어그룹, 페르소나로 나눈다. 이러한 분류들은 다른 이론적 배경을 가지고 있지만, 쓰임새가 비슷해서 기업 내에서 잘못 정의되는 경우가 많다. 특히 페르소나의 경우 산출과정에서는 데이터를 참고할 수 있지만, 실제로는 존재하지 않는 이상적인 세그먼트를 지칭할 때 자주 사용하기 때문에 다른 단어와 같이 쓸..

AiPRM 설치 및 활용 - 챗GPT Prompt 작성 지원 프로그램

AiPRM은 챗GPT의 기본화면을 AiPRM에서 제공하는 Prompt로 바꿔주는 크롬브라우저의 확장프로그램이다. 구글이나 크롬 웹스토어에서 'AiPRM'을 검색한 후 'AIPRM for ChatGPT'라는 링크를 통해서 설치하거나 아래 링크를 통해서 설치할 수 있다. AiPRM설치 URL 바로가기(크롬 웹스토어) [설치방법] 1. 크롬 웹스토어에서 Chrome에 추가를 누른 후 팝업에서 확장 프로그램 추가를 선택한다. 2. 자동으로 브라우저Tab이 추가되면서 ChatGPT 로그인창이 나타난다. 만약 아직 ChatGPT에 가입하지 않았다면 Sign Up을 누르면 가입과 동시에 로그인이 진행되며, 로그인을 완료하고 나면 아래와 같이 AiPRM연결을 진행할 것인지를 물어본다. 3. Continue를 누른 후 ..

유용한 TIP 2023.06.05

언어모델의 환각(Hallucination) 현상과 해결 방법

언어모델의 환각현상이란 환각(Hallucination)현상이란 언어모델이 잘못된 사실을 확정적으로 답변하는 것에 대해 인간이 환청, 환시과 같이 감각기관의 자극이 없음에도 무언가를 지각하는 현상에 빗댄 것이다. 환각현상은 AI가 겪고 있는 증상을 말하며, 실제 이용자가 느끼는 현상은 공상허언증(사실이 아닌 것을 왜곡하거나 과장해서 말하는 증상)에 가깝다. 이러한 현상은 모방학습을 통해 유사한 결과를 생성하는 생성형 AI들의 특징으로, 언어모델에서는 확률에 기반하여 문장을 생성하는 Transformer알고리즘의 한계로 인한 것이다. 이런 문제점에도 불구하고 빌게이츠는 “과거 인터넷 발명만큼 중대한 발명이 될 수 있으며, 우리의 세상을 바꿀 것”이라고 말하며 상용화에 앞장서고 있으며, 정작 오픈AI를 설립했..

AICC(AI Contact Center) 현황과 성장 전망

AICC 정의 AI Contact Center는 AI를 이용하여 고객의 문의나 요청사항을 처리하는 시스템 또는 이를 관리하는 부서를 말한다. 현재의 AICC는 보통 챗봇과 음성봇(Voice bot)이 주를 이루며, 이메일 및 게시판 문의사항을 응대하거나 기존 상담원을 보조하는 기능을 수행한다. 현재 챗봇은 주로 고객 문의사항을 수행하면서 모바일 App 또는 웹페이지를 안내하며, 음성봇은 ARS와 연동하거나 고객에게 직접 전화를 걸어 계약을 확인하는 등의 역할을 수행한다. AICC 현황 및 전망 구글은 클라우드에서 기업이 직접 AICC를 구축할 수 있는 Contact Center AI(CCAI) 서비스를 제공하고 있으며, Dialogflow를 통해 챗봇, 음성봇을 만들거나 Agent Assist를 활용해 ..

4.5. 플랫폼과 데이터 용도 변화

데이터는 개체의 모든 활동을 기록해둔 아카이브이자 자신을 스스로 되돌아볼 수 있는 일기장 같은 역할을 한다. 통계학자와 컴퓨터공학자들은 아카이브를 체계적으로 관리하는 방법을 오랜 시간 동안 연구해왔으며, 일기장을 들춰 새로운 사실을 도출하거나 판단하는 방법도 제시해왔다. [ 데이터의 활용 주체와 주요 활용 방법의 변화 ] 구분 활용처 주요 활용 방법 3차 산업혁명 초기 (PC) 기업 [수집]DBMS기반 업무용 데이터 수집 [요약]실적 보고서 등 장표 작성 [추론]내부 데이터 기반 인사이트 도출 [예측]마케팅, 신용평가 모델 개발 3차 산업혁명 중기 (인터넷) 소비자 [수집]웹/앱에서 주문 및 게시글 작성 [요약]시각화된 정보 활용 [추론]공개 데이터 기반 인사이트 도출 [예측]개인화된 서비스 이용 4차 ..

초거대 AI 등장과 파라미터에 의한 주도권 변화

AI 파라미터와 초거대AI AI 파라미터(Parameter)는 딥러닝에서 알고리즘을 구성하는 최소단위의 모델이 다른 층의 모델에 전달하는 매개 변수를 말한다. 딥러닝은 파라미터의 개수가 많을수록 데이터 한꺼번에 입력받아 복합적으로 처리할 수 있다. 자연어를 생성하는 언어모델(Language Model)은 문장을 구성하는 단어의 의미와 맥락 등 다양한 데이터를 사용하며, 파라미터 개수가 클수록 문장 생성에 필요한 확률 계산을 더 잘 할 수 있다. GPT-3는 레이어 96개에 각 18억개로 총 1750억개의 파라미터를 가지고 있으며, GPT-4의 파라미터는 공개되지 않았지만, 1조개 이상으로 추정되고 있다. 빅테크기업들은 언어모델을 비롯하여 이미지, 음성AI 등에 사용되는 파라미터 개수를 늘리기 시작하였으며..

4.4. 기업이 AI를 만들고 활용하는 방법

챗봇과 자율주행, 그리고 이미지 생성까지 다양한 역할을 하는 AI가 출시되고 있다. 인간을 대체하기 아직 미흡한 부분이 있을지는 모르지만, 앞서 비정형 데이터 처리에서 소개한 OCR과 STT 같은 경우에는 데이터 분석 업무에서도 이미 필수적인 부분을 차지하기도 한다. AI가 만들어지는 과정 자체는 사실 여타의 데이터 분석 방법들과 유사하다. 데이터를 수집한 후 수치 형태로 변환하고 수학 공식을 기반으로 한 알고리즘을 활용하여 분류하거나 예측하는 모델을 만들거나, 여러 개의 모델을 조합하여 하나의 프로그램으로 구성하는 것이다. 다만, 현재와 같은 AI가 만들어지기까지는 딥러닝(Deep Learning)이라는 조금 특별한 알고리즘이 중요한 역할을 하였다. 딥러닝은 복잡한 분류 및 예측 문제를 해결하기 위해 ..

반응형