메타가 대화형 AI를 무료로 공개하는 이유

최신 데이터 동향 및 향후 전망

메타가 대화형 AI를 무료로 공개하는 이유

정데만 2023. 6. 21. 14:20

메타가 드디어 참전했다. 그것도 예상보다 빠르게

오늘자 기사에서 메타가 자사의 대규모 언어모델(LLM)을 상업용으로 공개하겠다고 선언을 했다. 안그래도 2월달에 내부자 유출과 같은 형태로 모델이 공개되었는데, 별다른 회수 조치는 하지 않길래 이것조차 자작극이거나 시장 상황을 지켜보다가 라이센스를 풀어버릴지도 모른다고 생각했던 차였다.

☞ 관련기사 : 메타 LLaMA AI 모델 유출…무분별한 활용 우려 커져(ITWORLD, 23.3.9 기사 바로가기)

다만, 학계에서 모델 활용에 충분히 익숙해지고 이러한 인력들이 기업과 협력할 때쯤, 그러니까 빠르면 올해 연말 쯤이나 라이센스가 공개될꺼라 생각했는데, 예상보다 학계의 호응이 좋았던 건지 아니면 GPT로 인해 시장이 너무 빠르게 성장하자 위협을 느끼고 재를 뿌리고 싶었던건지는 모르겠으나 여튼 생각보다 정말 빠르게 라이센스가 풀려버렸다.

참고로 국내 IT기업들이 □□GPT라고 부르는 대규모 언어 모델들은 자체적으로 개발된 모델들이다. 오픈AI는 GPT모델을 더 이상 공개하지 않기 때문에 소스를 가져다가 □□GPT라는 제품을 만드는 건 불가능하지만 공개된 기술이나 논문을 참고하여 생성한 모델이고 GPT라고 이름을 붙이는 편이 홍보에 유리하기 때문이다.

그럼에도 불구하고 국내 대기업들은 모델을 공개하진 않는다. 오픈소스 정책으로 살아남기에는 시장이 너무 빈약하다고 느낀건지 아니면 스스로 불완전하다고 생각한건지는 모르겠으나, 국내 기업에서 만든 대규모 언어모델을 사용하려면 해당 기업과 협약하는 것 밖에 방법이 없다.

그래서 자국 모델이 있음에도 대부분의 기업들은 결국 공개된 모델을 사용할 수 밖에 없었고, 라이센스 문제로 구형 모델을 활용하거나 학습 리소스 문제로 소형 모델을 가져다 쓰면서 짠내 나는 상황을 서로 안타까워 했었는데, 메타가 라이센스를 허용해버렸으나 산학의 길이 활짝 열린 학계도, 비용과 성능 문제가 해결된 업계에서도 아주 반가울 수 밖에 없다.

아래는 대규모 언어모델의 파라미터 사이즈를 비교한 표인데, 이번에 메타가 공개할 것으로 예상되는 LLaMA모델의 파라미터 개수는 650억개로 GPT-3(1750억개)에 비해서는 작은 모델이지만, 종전에 무료로 쓰던 구글 T5(110억개)보다 충분히 큰 파라미터를 가지고 있으며, 테스트해본 결과 한국어 부문에서도 꽤 좋은 성능을 낸다고 한다.

기사는 어떤 내용을 담고 있을까?

구글·MS 주도 AI판세 뒤집겠다는 메타…무료 상업용 LLM 공개계획(머니투데이, 23.6.21 기사 바로가기)

오늘자 기사는 단순 사실만 알렸을 뿐 아니라 내용에서도 꽤 좋은 내용을 담고 있어서 각 단락별로 쪼개어 주석을 달아보고자 한다. 혹시 기사가 어렵게 느끼지는 분이 계시다면 주석만 읽어도 꽤 재밌을 꺼라 생각한다.

오픈AI와 구글이 주도하는 생성형 AI(인공지능) 시장에서 메타(구 페이스북)가 '메기' 역할을 할지 주목된다. 기술력을 무기로 폐쇄·유료 전략을 고수하는 오픈AI나 구글과 달리 메타는 무료로 상업용 초거대 언어모델(LLM)을 공개할 계획이기 때문이다. 학계를 중심으로 영향력을 확보한 메타가 상업용 LLM 모델까지 오픈소스로 내놓으면 유료인 GPT가 차지한 시장을 잠식할 수 있다는 관측도 나온다.

① GPT에 재를 뿌리기 싶다.

20일 업계에 따르면 메타(구 페이스북)은 연내 자사 LLM 모델 LLaMA(라마)를 업그레이드해 상업용으로 선보일 예정이다. 지난 2월 공개된 현 라마는 학계·정부·시민단체 등이 연구 목적으로만 사용할 수 있다. 상업적 이용은 허용되지 않는다.
메타가 상업용 라마 모델을 개발하기로 한 것은 업계의 요청 때문으로 보인다. AI 학계는 이미 무료 모델인 라마를 중심으로 돌아가고 있다. 상업화와 함께 폐쇄 전략을 택한 구글과 오픈AI 사이, 틈새시장을 공략한 메타의 전략이 먹혀들어 간 것이다. 월스트리트저널(WSJ) 등 외신에 따르면 라마를 경험해 본 개발자들은 이를 상업용으로 쓸 수 있게 해달라고 지속적으로 요구하고 있다.

② 우리는 이미 학생들한테 간을 봤다.

현재 LLM 시장을 주도하고 있는 오픈AI-MS(마이크로소프트) 연합과 구글은 연구 중심에서 상업화 중심으로 운영 방식을 전환했다. 챗GPT의 성공으로 주도권을 잡았다고 판단한 오픈AI와 MS는 지난 3월 발표한 새 LLM 'GPT-4'의 기술적인 내용을 대부분 공개하지 않았다. 구글도 지난 5월 발표한 새 LLM PaLM2에 대한 기술적 정보를 상세히 공개하지 않았다. 이들은 모델을 공개하는 대신 API(응용 프로그램 인터페이스)나 플러그인(Plug-in) 등을 판매하고 있다. 업계는 이들이 막대한 초거대 AI 개발비와 운영비 충당, 심화되는 AI 경쟁 상황 등을 이유로 폐쇄 전략을 고수하는 것으로 보고 있다.

③ 너희들만 돈벌고 있는 상황에 메타는 배알이 꼴린다.

메타가 상업용 라마를 무료 공개하면 오픈AI와 구글의 점유율을 크게 나눠가질 전망이다. GPT나 PaLM 모델보다 성능이 조금 떨어지더라도 무료라면 라마를 활용해 상업용 서비스를 개발하려는 기업이 수요가 많기 때문이다. 아울러 라마의 성능은 학계에서 이미 검증됐다. 특히 메타는 이미지와 언어를 혼합한 멀티모달 모델에 강점이 있어 관련 서비스를 기획 중인 기업과 손잡을 수 있다.

④ 교수들을 이용해서 기업에 무료로 깔아버릴 것이다.

메타 입장에서도 무료로 LLM을 공개하는 것이 손해 보는 장사가 아니다. API나 프로덕트 판매 등으로 수익을 올릴 수는 없지만, 전 세계 연구·개발자와 함께 모델을 고도화할 수 있기 때문이다. BM(비즈니스 모델)은 시장 지배력을 확보한 이후 마련해도 충분하다는 판단이다. 오픈AI와 구글이 지배하는 시장에서 같은 유료 모델로 경쟁하는 것보다 무료 모델로 아예 판을 뒤집는 것이 더 승산 있다고 판단한 것이다.

⑤ 지금은 돈이 안되지만 공짜 맛을 본 기업들은 결국 우리한테 돈을 지불할 것이다.

하정우 네이버클라우드 AI 이노베이션 센터장은 "메타의 LLM이 오픈AI나 구글 LLM보다 모델 크기(파라미터 개수)는 작지만, 특정 분야를 위한 작은 LLM 활용 서비스를 만드는 기업에게는 도움이 많이 될 것"이라며 "특히 라마는 챗GPT나 바드처럼 여러 언어를 할 수 있지 않고 영어에 집중한 모델이기 때문에 글로벌 시장을 노리는 기업이 관심을 가질 것"이라고 설명했다.

⑥ (네이버 왈) 어? 어? 이러면 안되는데...

'최신 데이터 동향 및 향후 전망' 카테고리의 다른 글

인간의 창작과 생성형 AI의 동작 방식 (65)	2023.06.30
언어 모델의 원리로 알아보는 AI의 인격 (69)	2023.06.27
디지털 휴먼 기술과 활용 방식, 그리고 비전 프로의 MR전략 (68)	2023.06.26
서치AI로 인해 더욱 중요해진 검색의 기술(feat. 네이버) (91)	2023.06.25
챗GPT등장에 따른 기업의 AI활용 변화 (38)	2023.06.18

현재글메타가 대화형 AI를 무료로 공개하는 이유

정데만(Honest Data Only)