최신 데이터 동향 및 향후 전망 27

AI 생산성 도구의 방향성과 대표적인 코파일럿

생성형AI를 활용한 생산성 도구 확산 새로운 기술에 대한 관심이 투자로 이어지고 신상품 출시와 함게 다시 기술이 발전하는 순환구조가 작동하면서, 전쟁과 경기침체로 우울한 세계 경제에 조금이나마 활력을 불어넣고 있다. 결과물을 텍스트, 이미지, 음성과 영상으로 분류했을 때 각기 다른 AI기술이 적용되면서 빠른 발전을 이루고 있지만, 특히 텍스트분야에서 챗GPT가 엄청난 가능성을 보여주었고, 언어모델이라는 특수성으로 인해 단순한 문장 생성이 아닌 검색과 인터페이스, 그리고 생산성 도구로의 성장 가능성을 확인시켜주었다. 이번 포스트에서는 환각현상이라는 기술적인 한계로 오히려 지원 용도에 적합하고, 단기적 가장 먼저 크게 성장할 것으로 예상되는 있는 생산성 도구에 대해서 알아보고자 한다. 전세계 노동의 18%가..

국내 초거대 AI 구축에 대한 냉정한 현실

지난 7월 LG가 엑사원 발표할 때만해도 그다지 반응이 없더니, 네이버가 하이퍼클로바X를 발표하자 증권사를 비롯한 언론과 관련 업계까지 전반적으로 떠들석하다. 이는 국산 LLM을 구축했다는 사실보다는 초거대 AI가 얼마나 비즈니스 영향력을 가지고 있는지에 따라 시장이 반응하는 것으로 IT업계에서 네이버의 영향력이 얼마나 큰지 짐작케 하는 것이다. 최근 기획 기사들이 많이 보도되고 있으며, 심도 있는 자료들도 나오고 있는 만큼 현 상황에 대한 나름의 진단을 정리해보고자 한다. 국내 초거대 AI 개발현황 현재 국내 초거대 AI개발현황은 아래와 같다. 이 중 빅테크와 견줄만한 수준의 LLM(GPT 3.5 기준 1750억개 이상)을 가지고 있는 기업은 네이버, LG, KT(10월 출시예정) 정도이며 이 중 B2..

한국어의 특성으로 보는 클로바X 성능 비교

GPT가 발표되면서 초거대AI라는 말이 생겨나고 빅테크업계에 파라미터 경쟁이 시작되었다. 파라미터의 개수가 초거대AI의 성능을 보여주는 지표가 되기 시작했고, GPT4는 어느덧 1조개에 달하는 파라미터를 가지고 있다. AI의 파라미터는 뉴런을 연결하는 시냅스처럼 퍼셉트론(인공뉴런)을 연결하여 뉴런간의 정보를 전달하는 역할을 한다. 그래서 파라미터의 개수가 많다는 것은 같은 정보라도 뉴런 간의 소통을 통해서 더욱 다양한 정보를 해석할 수 있다는 것을 말하며, 인간이 성장하면서 경험에 따라 시냅스가 많아지는 것과 유사하다. 하지만, 인간도 경험이 많이 쌓일수록 새로운 지식에 대해 종전의 학습치를 갱신하기 어려운 것처럼 AI또한 파라미터가 많아질 수록 데이터를 학습하는 과정에서 조정해야하는 파라미터가 많아져 ..

네이버 사업구조로 보는 하이퍼클로바X 경쟁력과 데이터 전략

오픈 전부터 보도자료로 엄청나게 예열하더니 네이버가 드디어 어제(8.24) 하이퍼클로바X를 발표하고 선착순으로 베타테스터 인원을 받기 시작했다.(☞ 대기 등록하기) 서비스가 오픈된 후 실체가 드러날 때쯤 포스트를 작성하려고 생각했었는데, 발표된 내용 중 미처 예상하지 못했던 부분도 있길래 이해를 도울 겸 네이버가 구상하는 내용을 뒷받침할 만한 자료를 정리해보았다. 네이버와 구글의 사업구조 비교 네이버는 글로벌 빅테크와 비교해봐도 상당히 특이하면서 견고한 사업구조를 가지고 있다. 대부분의 빅테크들이 창업당시 가졌던 비즈니스 모델에서 크게 벗어나지 못하고 있는 반면에 네이버는 끊임없이 사업을 확장하면서 여러 분야에서 성과를 거두었고 빅테크에 견줄만한 서비스도 조금씩 만들어내고 있다. 아래의 네이버 전체 사업..

메타의 행보로 바라보는 플랫폼의 LLM(거대언어모델) 활용 전략

(23.2월) AI관련 부서 조직개편 메타는 GPT열풍이 한참이었던 올해 2월 '생성형 AI팀'을 출범시켰다. 이는 4월에 사내 브레인팀과 영국소재의 자회사 딥마인드를 합친 구글보다 좀 더 빠른 의사결정이었으며, 재밌게도 메타에서도 유럽팀과 미국팀의 갈등이 심하다고 한다. ☞관련기사 : 메타 생성형AI 제품 개발 드림팀 꾸렸다…인스타그램, 왓츠앱 등으로 상용화 모색(2.28) ☞관련기사 : 메타, 돈 안되는 AI 단백질 데이터베이스 팀 해체...상용화에 집중(8.8) (23.3~7월) 언어모델 유출 및 공개 사명까지 바꿔가면서 메타버스와 VR사업에 매진하다가 AI를 등한시 한 것을 뒤늦게 만회하려고 하는건지 메타는 과감한 전략을 쓰기 시작했다. 조직개편과 함께 공개했던 언어모델 라마2(LLaMA2)가 유..

앤드류 응 교수의 데이터 중심 AI(Data-centric AI)

샘 알트만(오픈AI) - 홍채데이터 오픈AI 대표 샘 알트만에 이어 AI 4대 석학이라는 앤드류 응 교수까지 AI업계에 유명한 사람들이 연달아 한국을 방문하고 있다. 지난 번 샘 알트만은 ▲국내 반도체와 협력, ▲AI스타트업 투자, ▲AI활용 규제에 대한 예기를 남기고 갔었다. 하지만, 당시 월드코인 프로젝트를 진행 중이었고, 어제(7.25) 거래소에 상장하면서, 당시 월드코인 홍보가 방한의 주목적이었다는 말에 설득력이 실린다(관련 기사) 월드코인은 홍채인식이 AI와 인간을 구분하는 수단이라며 오브라는 기기에 홍채를 등록하면 코인을 무료로 지급하는 프로젝트로 진짜 목적이 무엇인지는 모르겠으나 엄청난 양의 홍채데이터와 개인이 식별된 상황에서 코인을 주고 받는 데이터까지 확보할 것은 자명해보이는데, 아프리카..

원하는 정보를 찾는 방법과 AI검색엔진 시대의 도래

검색엔진의 시작 초창기 검색엔진은 인터넷이라는 개방형 네트워크 기술에서 웹사이트를 찾아주는 역할을 하였다. 현재도 명맥을 유지하고는 있지만, 당시의 검색엔진들은 웹사이트 담당자가 웹사이트와 이를 소개하는 글을 등록하면 검색엔진이 일일이 심사하여 웹사이트를 종류별로 분류하고 소개 글에 있는 정보를 활용해 키워드로 검색하는 거대한 사이트맵과 같았다. 인터넷이 확산됨과 동시에 PC의 보급과 기술 보편화로 개인과 기업에서 관리가 잘 되지 않는 웹사이트를 마구잡이로 쏟아내었고, 야후와 같은 검색엔진들은 우량한 웹사이트를 선별한다는 이유로 막강한 노출 권한을 휘두르고 있었다. 그러나, 수작업에 가까운 웹사이트 선별방식은 경직된 서비스를 제공할 수 밖에 없었고, 사람들은 야후가 제공하는 정갈한 정보에서 벗어나 빠르게..

거대 플랫폼 기업들이 데이터를 모으는 방법과 규제

개인정보위 구글, 메타에 과징금 부여(22.9월) 22년 9월 개인정보위원회가 구글과 메타에 1,000억원의 과징금을 부여하면서, 구글과 메타의 개인정보 수집 방법에 대해 자세하게 보도자료를 작성하였다. 보도자료에서 지적한 내용을 토대로 플랫폼 기업의 데이터 수집 방법에 대한 중요한 내용을 간추려보면 다음과 같다. 1. 구글은 크롬, Google서비스를 이용하는 모든 웹사이트, 앱, 기기에서 고객의 활동정보를 수집하여 이용한다. 2. 메타는 소셜 플러그인, Facebook 로그인, API와 SDK(소프트웨어 개발 도구) 등을 활용해서 고객의 활동정보를 수집한다. 3. 구글은 사용자의 음성과 오디오 녹음 정보도 수집한다. 4. 메타도 타사 정보를 수집한다. 5. 구글은 광고 최적화라는 명목으로 수집한 정보..

챗GPT 제멋대로 행동을 차단하는 오픈AI 슈퍼정렬팀

챗GPT 방문자수 감소 지난 주 챗GPT 조회수와 다운로드가 감소하기 시작했다면서 구글의 점유율은 오히려 상승했다는 내용의 기사가 쏟아졌다. 시밀러웹이 공개한 월간 방문자 수에 따르면 실제 6월 방문자 수가 5월 대비 9.7%로 꽤 크게 감소했으니 세상이 바뀔 것처럼 난리 법석을 떨었던 사람들의 입장에서는 조금 실망스러울 법하다. 게다가 기사 대부분에서 구글 점유율과 저작권에 대한 시비까지 언급하는 걸 보면 챗GPT의 몰락을 은근히 기대하는 사람들도 있는 것처럼 보인다. 하지만, 애초에 업계에서 주목했던 건 오픈AI가 방문자 수로 구글을 꺾는 것이 아니었다. 애써 가장 강력한 언어모델을 가져가고도 구글과 제대로 경쟁도 못하는 빙챗에는 좀 실망스럽지만, MS가 원래 인터넷에서 그리 강한 기업은 아니었다. ..

스레드 오픈, 소셜데이터는 어떻게 분석할까?

스레드 오픈 스레드(Threads)가 오픈한지 하루반만에 가입자 7000만명을 돌파했다. 전세계를 대상으로 한 IT기업의 수장답게 때 마침 터져준 격투기 이슈를 고스란히 사업에 활용하는 수완을 보며 감탄을 금치 못했지만, 블로그 취지에 맞게 소셜 플랫폼 CEO들의 격투기 이슈보다는 소셜데이터를 분석하는 방법에 대해서 예기해보고자 한다 연결과 관심사 저커버그는 스레드를 개방형 대화 플랫폼 앱이라고 하며, 트위터를 경쟁사로 지정였다. 또한, 인스타그램의 텍스트 버전이라고 표현하기도 했다. 이는 스레드라는 소셜 앱으로 가지는 방향성을 말하는 것인데, 스레드를 통해 발생하는 데이터에도 고스란히 영향을 끼치게 될것이다. 소셜 데이터 분석은 크게 "연결"과 "관심사" 2가지로 나눠서 분석된다. 소셜 네트워크(연결)..

반응형