최신 데이터 동향 및 향후 전망

챗GPT 제멋대로 행동을 차단하는 오픈AI 슈퍼정렬팀

정데만 2023. 7. 9. 20:01
728x90
 

 

 

챗GPT 방문자수 감소

지난 주 챗GPT 조회수와 다운로드가 감소하기 시작했다면서 구글의 점유율은 오히려 상승했다는 내용의 기사가 쏟아졌다.
 
시밀러웹이 공개한 월간 방문자 수에 따르면 실제 6월 방문자 수가 5월 대비 9.7%로 꽤 크게 감소했으니 세상이 바뀔 것처럼 난리 법석을 떨었던 사람들의 입장에서는 조금 실망스러울 법하다.
 
게다가 기사 대부분에서 구글 점유율과 저작권에 대한 시비까지 언급하는 걸 보면 챗GPT의 몰락을 은근히 기대하는 사람들도 있는 것처럼 보인다.
 
하지만, 애초에 업계에서 주목했던 건 오픈AI가 방문자 수로 구글을 꺾는 것이 아니었다. 애써 가장 강력한 언어모델을 가져가고도 구글과 제대로 경쟁도 못하는 빙챗에는 좀 실망스럽지만, MS가 원래 인터넷에서 그리 강한 기업은 아니었다.
 


 

언어모델은 저변화된 기술

기술적으로도 GPT가 현재 기준 가장 뛰어난 언어모델을 선보인 것은 맞지만, 기술 대부분은 원래 구글이 먼저 공개했었고, PaLM2(바드 적용 모델)보다 개선된 제미나이(관련 기사)개발 소식을 알리면서 열심히 추격하고 있으니, 앞으로도 GPT가 계속 왕좌를 차지할꺼라는 보장은 원래 없었다.
 
또한, 섣불리 이 싸움에 끼지 않을 것 같던 메타는 LLaMA를 무료로 공개(관련 포스트)하면서까지 업계를 부추기고 있으니 하드웨어, 알고리즘, 데이터 3박자가 모두 맞아야만 하는 언어모델 알고리즘에서 GPT가 아니더라도 영원한 강자는 존재할 수 없다.
 
다만, GPT는 다들 서비스에 활용하는 걸 망설이던 애매한 기술에 프롬프트와 AI플러그인, 그리고 대화형 에이전트를 활용함으로써 누구보다 빠르게 시장에 정착시켜 가장 선두에 선 입장이 되었으며 느슨한 AI업계에 긴장감을 주었지만,
 
여기서 이대로 꺾여버린다면 GPT가 몰아준 이슈는 구글이나 다른 IT업체가 차지해버리고 GPT는 결국 언어모델 API나 제공하는 역할에만 그치게 될 것이다.

 


 

당장의 방문자보다는 기술 우위

그럼에도 불구하고 GPT가 꺼내든 대응방식을 보면 당장의 방문자 수에는 그다지 연연하지 않는 모습을 보인다.
 
그도 그럴 것이 토큰 1천개당 39.3원(GPT4기준)까지 받는 API 제공사로써 트렌드만 놓치지 않으면, 시장과 함께 저절로 성장될 것이 뻔한데, 모델하우스 정도 역할을 하는 챗GPT의 사용량 감소에 너무 연연할 필요는 없는 것이다.
 
그보다는 오히려 환각현상에 대한 근본적인 의구심을 해소하며 AI사업 성장을 정체시키지 않는 편이 낳다.

현재까지 환각현상에 대한 근본적인 해결방법이 나오지 않은 상태에서 오픈AI가 슈퍼정렬(Superalignment)팀을 구성하면서 내놓은 해결방안은 아래와 같이 3가지로 구성된다.

 

1) 다른 AI시스템에 의한 평가(Evaluation of other AI systems)

2) 문제 행동에 대한 검색 자동화(Automate search for problematic behavior)

3) 적대적 테스트(Adversarial testing)

(출처 :  Introducing Superalignment (openai.com))

 

대안으로 꺼낸 내용 3가지 모두 알고리즘에 대한 개선이 아닌 관리감독과 감시를 강화하는 것으로 그 동안 인간이 하던 성능 테스트(프롬프트 엔지니어링)를 AI로 전환하겠다는 것이다.

 

최근의 AI운용 방식으로 감시용 AI를 만드는 것은 어느 정도 예상 가능했지만, 이를 소개하는 문서에서 주석으로 붙여둔 말에는 약간 소름끼치는 내용을 포함하고 있다.

 

But humans won’t be able to reliably supervise AI systems much smarter than us(인간은 우리보다 훨씬 똑똑한 AI 시스템을 안정적으로 감독 할 수 없습니다)

 

무슨 의도로 이런 끔직한 문장을 넣어뒀는지는 모르지만, 기술도 방식도 머리로는 이해가지만, AI로 AI를 감시하겠다는 표현은 아직은 조금 거부감이 든다.

 

그리고 의도는 이해 못하고 단어만 걸러내는 감시 방식으로 인해 바드처럼 멍청해지지는 않을지 걱정이 되기도 한다.

 

바드는 의학관련 답변을 일체하지 않는다.

 

완강하게 버티는 바드

 


728x90