분류 전체보기 108

챗GPT로 동작하는 AI툴을 만들어보자! 뤼튼 스튜디오

얼마 전 국내 AI인터페이스로 소개했던 뤼튼(이전 글 보기)의 '툴'메뉴에서 CBT중이던 AI제작 스튜디오가 정식 오픈했다. 자기소개서 등의 툴이 올라와있던 걸 감안하면 AiPRM(이전 글 보기)처럼 GPT를 기반으로 프롬프트를 활용한 툴로 예상되었는데 완성도도 궁금하고 GPT4를 무료로 제공하는 업체이니 AiPRM보다 좀 더 좋은 성능을 무료로 쓸 수 있지 않을까 하는 기대감에 바로 테스트를 해보았다. 뤼튼 스토디오 바로가기 뤼튼 스튜디오를 시작하면 다음과 같은 대시보드가 먼저 보인다. 등록되어있는 테스트는 임의로 만들어본 것으로 처음 들어가면 텅빈 화면이 나온다. 1단계. 기본정보(제목과 소개) 바로 테스트를 시작해보자! 테스트해볼 항목은 TA(Text Analysis)시절 인기 있던 주식종목에 대한..

유용한 TIP 2023.06.22

메타가 대화형 AI를 무료로 공개하는 이유

메타가 드디어 참전했다. 그것도 예상보다 빠르게 오늘자 기사에서 메타가 자사의 대규모 언어모델(LLM)을 상업용으로 공개하겠다고 선언을 했다. 안그래도 2월달에 내부자 유출과 같은 형태로 모델이 공개되었는데, 별다른 회수 조치는 하지 않길래 이것조차 자작극이거나 시장 상황을 지켜보다가 라이센스를 풀어버릴지도 모른다고 생각했던 차였다. ☞ 관련기사 : 메타 LLaMA AI 모델 유출…무분별한 활용 우려 커져(ITWORLD, 23.3.9 기사 바로가기) 다만, 학계에서 모델 활용에 충분히 익숙해지고 이러한 인력들이 기업과 협력할 때쯤, 그러니까 빠르면 올해 연말 쯤이나 라이센스가 공개될꺼라 생각했는데, 예상보다 학계의 호응이 좋았던 건지 아니면 GPT로 인해 시장이 너무 빠르게 성장하자 위협을 느끼고 재를 ..

AI 추가 학습의 종류와 리소스(Fine-Tuning, Prefix tuning, LoRa)

초거대AI의 파라미터 GPT와 같은 초거대 AI는 데이터를 학습하면서 AI를 구성하는 최소 단위의 모델 "퍼셉트론"의 계산 결과를 연결해주는 엄청난 양의 파라미터를 가지고 있다. 인간의 뇌는 뉴런이 처리한 정보를 시냅스가 전달하고 집적된 신호를 바탕으로 판단을 내리는 데, AI 또한 퍼셉트론(인공 뉴런)이 정보를 처리하면 파라미터(시냅스 역할)가 이를 전달하여 최종 예측을 진행한다. 인간이 성장할 수록 시냅스를 늘려나가듯이 초거대 AI도 데이터와 처리량이 많아지면서 파라미터를 지속 확대해 왔는데, GPT 4를 기준으로는 전작에 비해 6배에 달하는 1조 개까지 도달하였다. 다만, 기존 AI의 파라미터에 비해 많을 뿐 인간의 시냅스(성인 기준 100조 개)에 비하면 아직 부족하다는 의견도 있으며, AI의 성..

음성 합성 기술 - TTS(Text To Speech, 텍스트의 음성 전환)

TTS의 정의와 적용 현황 음성 합성(Speech synthesis 또는 Text To Speech) 기술이란 인간의 말소리를 합성하는 기술로서 텍스트를 입력하면 음성의 발음, 속도, 호흡, 운율 등을 추정하여 녹음해둔 음성을 조합하거나 생성하는 기술이다. 1930년대 텍스트를 입력하면 이에 맞춰 피아노를 동작시키는 아이디어에서 시작하여 80년대부터 본격적으로 상용화되었으며 90년대에 이르러서는 음성 인식(STT, Speech To Text)과 더불어 활용도가 넓어지기 시작하였다. 초기에는 시각장애인을 위한 기술 위주로 시작하였으나 상용화되면서 안내 음성, ARS 등 기계음의 영역에서 이용되었으며, 현재는 AI를 기반으로 자연스러운 음성을 만들어짐에 따라 오디오북, 게임, AI앵커 등과 같은 성우의 역할..

AI음성인식 기반 자동 자막 생성 프로그램 - VREW

AI음성인식 기술은 기술과 라이브러리가 공개되어 있고 데이터도 공개되어 있는 편이라 비교적 쉽게 만들 수 있는 AI에 속한다. 그래서 관련 스타트업도 많고 시중에 이런 저런 앱들도 출시되어 있지만, 앞서 포스트(관련 글 바로가기)에서도 언급하였듯이 말의 늬앙스와 소음 등에 영향을 받기 때문에 좋은 성능을 가진 AI를 만들기는 쉽지 않다. 인간이 그렇듯이 AI도 어떠한 교재와 데이터로 학습하는 지에 따라 전문성이 달라지며, 대기업제품(구글, 애플, 네이버 등)이 만든 모든 분야에서 좋은 성능을 내야 하는 AI들은 특정분야에서 오히려 성능이 떨어지기도 한다. 오늘 소개하려고하는 AI도 대기업제품 못지 않은 성능을 가졌다는 이야기를 듣고 응원하는 마음에 테스트도 해볼 겸 포스팅을 작성해본다. Vrew 이용방법..

유용한 TIP 2023.06.19

챗GPT등장에 따른 기업의 AI활용 변화

구글이 Bard를 출시하고 나서 작년 말부터 떠들석했던 MS와 구글의 LLM(Large Language Models, 대규모 언어 모델) 경쟁이 조금씩 진정되고, 관련 산업들도 방향을 잡고 있는 것처럼 보인다. 하나씩 올리고 있던 데이터 강의에서 언어모델을 작성할 때 쯤 LLM에 대한 기업의 대응 방안을 써볼까 했는데 예상보다 상황이 빨리 진정되고 업계와 학계 모두 얼추 대응안을 마련한 것 같아서 관련해서 글을 써볼까 한다. AI 학습 및 활용 데이터의 변화 GPT(Generative Pre-trained Transformer)는 이름에 포함된 단어에서 알 수 있듯이 사전학습된 생성형모델이다. Transformer라는 알고리즘도 궁금한 사람이 있겠지만, 기업에서 중요한 부분은 '생성형'과 '사전학습'이라..

AI툴 소개 및 랭킹 사이트 3곳

MS가 챗GPT를 연동한 Bing챗 시작한지 얼마되지도 않아 자사 오피스제품군에 AI를 접목한 코파일럿(Copilot)을 오픈하면서, 뒤늦게 Bard를 출시하여 이제 막 대화형AI서비스를 시작한 구글을 멀찌감치 따돌리고 있다. 시장에서는 이러한 흐름을 아이폰 출시와 함께 애플이 앱스토어를 구축하고, 구글이 플레이스토어를 출시하면서 두 회사가 앱생태계를 장악한 것처럼 MS는 챗GPT를 등에 업고 AI생태계를 빠르게 장악하려는 것으로 보기도 한다. 활용도가 높은 언어모델을 이용하여 개인과 기업에 AI플러그인이 확대되고 있지만, 사실 일부 사용자들은 이미 미드저니 비롯한 이미지AI와 음성, 영상분야의 AI도 활발하게 이용하고 있다. 그리고 국내에는 아직 보이지 않지만, 해외에서는 새로운 AI를 소개하고 랭킹을..

유용한 TIP 2023.06.18

고객 이탈 분석과 관리를 위한 퍼널 분석의 종류

퍼널분석(Funnel Analysis)은 고객이 방문부터 최종과정에 이르기까지의 단계별로 이탈하는 현상을 밑으로 내려갈수록 좁아지는 깔대기(퍼널, Funnel)모양에 빗대어 만들어진 분석방법이다. 단순하게 방문하는 순간부터 가입까지 도달하는 과정을 나누어 단계별 고객 수를 세는 것도 의미있지만, 각 단계들이 고객 행동 관점에서 어떤 의사결정이 필요한지, 그래서 왜 다음 단계로 넘어가지 않는지 알기 위해서는 마케팅 관점에서 퍼널 분석 모델을 선택하고 자사 프로세스에 적용해볼 필요가 있다. 퍼널 분석 기본 모델(AIDA) 퍼널 분석은 여러가지 모델이 있어서 시대에 따라 점점 발전한 것처럼 보이지만, 고객 행동을 분석하는 것이 목적이다보니 새로운 채널과 구매방법이 등장할 때마다 이에 따른 모델이 만들어지면서 ..

무료 AI이미지 생성 후 디자인에 바로 활용 - CANVA

생성형 AI를 활용한 생산성 도구들이 매일매일 쏟아지고 있다. 이전 포스트에서는 AI툴 랭킹 사이트를(바로가기) 통해서 유용한 툴을 찾는 방법을 안내한 적 있지만, 대중적인 툴에도 AI를 적용하고 있어서 소개해보려고 한다. CANVA는 미리캔버스, 망고보드와 더불어 PPT, 인쇄물, 웹사이트 등을 디자인할 때 많이 사용되는 툴이다. 디자이너가 아니어도 탬플릿을 이용하거나 기본 제공하는 텍스트, 아이콘 등의 디자인 요소를 이용하면 초보자라도 제법 그럴듯한 제작물을 만들 수 있다. 디자인 속도를 올려주기 때문에 전문디자이너들도 많이 이용하는 편이며, 최근에는 CANVA를 이용한 PPT, 그리고 포스트도 자주 눈에 띄곤한다. 참고로 CANVA는 호주, 미리캔버스와 망고보드는 한국툴이다. 1. CANVA 가입하..

유용한 TIP 2023.06.14

음성 인식 기술 - STT(Speech To Text, 음성의 텍스트 전환)

음성인식의 발전 과정 음성인식은 Speech Recognition 또는 STT(Speech To Text)으로 불리며, 인간의 육성을 인지하여 문자로 전환(기록)하는 기술을 말한다. 음성을 텍스트로 전환해주는 기술은 1950년대부터 숫자를 인지하는 것부터 시작하여 단어와 문장을 구분하는 형태로 발전하였으나 정체기에 있다가 AI를 활용한 예측기술이 도입되고 2010년 구글에서 Voice Speech를 발표하면서 각광받기 시작하였다. 구글과 애플은 기본적으로 음성입력장치가 부착되어있고 상시적으로 네트워크가 연결된 스마트폰을 통해 사용자들의 막대한 데이터를 수집하였으며 개인별로 다른 억양과 말투, 습관 등을 학습할 수 있었다. STT를 기반으로 한 음성 명령 체계는 TTS(Text to speech, 음성합성..

반응형