최신 데이터 동향 및 향후 전망

디지털 휴먼 기술과 활용 방식, 그리고 비전 프로의 MR전략

정데만 2023. 6. 26. 10:57
728x90
 

 

Mixed Reality(Microsoft)


애플 비전프로가 공개된지 3주 정도 지났다. 기기에 대한 흥분된 반응들도 얼추 끝나가고 이제 시장에서도 애플이 무엇을 하려는지 그리고 어떤 변화를 가져올 지 관심을 가지는 것 같다.

 

비전프로가 기존 VR기기와 가장 크게 다른 점은 공간컴퓨팅기술을 강조하며 아이사이트 / 페르소나 / 공간음향을 추가했다는이다.

 

가려진 얼굴을 외부 디스플레이에 송출하면서 기기를 착용한 사람이 주변인과 동화될 수 있도록하고, 페르소나를 통해 아바타가 아닌 실제 모습으로 소통하며, 물체가 사람이 있는 방향에서 소리가 들리게하여 현실과 가상세계를 최대한 혼합하려는 노력하였다.

 

이러한 노력은 애플이 혼합현실(MR, Mixed Reality)을 추구하기 때문인데, 애플의 MR전략을 통해 비전프로를 VR게임기가 아닌 스마트폰 수준의 만능 기기로 만드려는 것이 아닐까라는 생각이 들게 만든다.

 

아이폰이  MP3, PMP, 카메라 등의 포터블기기를 없애고 그걸 합한 만큼의 가격으로 팔리는 것처럼 비전프로가 TV, PC, 게임기와 같은 가전기기를 없애고 그 자리를 차지한다면 사람들은 애플이 제시한 가격대로 비전프로를 구매해야 할 지도 모른다.

 


 

스마트폰이 등장하면서 이미 수 많은 컨텐츠와 비즈니스 모델이 앱스토어로 빨려 들어갔다.

 

비전프로의 특성상 처음에는 게임, 영화와 같은 VR로 구현하기 쉬운 것부터 이동하겠지만, 해당 기술은 VR이 아닌 MR(혼합현실)을 추종하기 때문에 현실에나 있을 법한 인격체가 훨씬 잘 구현될 것이다.

 

실물과 가상이 혼합된 현실에서는 가상PET과 가상인간이 훨씬 자연스럽게 현실과 동화될 수 있다.

 

 

MR환경은 VR과 달리 메타버스처럼 현실과 분리된 곳에 있지 않다. 그래서 독립된 규칙이 적용된 가상세계보다 현실의 경제 활동과 훨씬 잘 융합될 것이며, 애플은 생태계를 구축하기 위해 기업들을 최대한 많이 참여시킬 것이다. 이미 디즈니를 끌여들여 컨텐츠를 개발하고 있으며 21일에는 개발자툴도 공개하였다.

(애플 비전 프로를 위한 개발자 툴, 오늘부터 이용 가능)

 

변화는 근무환경에서부터 시작될 수 있다. 직원들은 이미 코로나를 거치면서 화상회의의 어색함을 극복했으며, 재택근무의 안락함으로 겪어보았으니, 힘든 출근길보다는 조금 답답하지만 편리한 MR기기를 선택할지 모른다.

 

또한, 가뜩이나 인건비 절감을 위해 꾸준히 업무를 자동화시키던 기업들은 24시간 무임금으로 고객을 응대해주는 가상인간을 누구보다 반길 것이다.

 

마침 필요한 기술들은 준비되어 있고 모두가 원한다면 변화는 생각보다 빠르게 찾아온다.

 

메타버스(출처 : 뉴욕타임즈)

 

가상인간을 구성하는 기술은 총 4가지이다.

 

1. 언어모델(Large Language Model, 관련 포스트 바로가기)

2. 음성인식(Speech to Text, 관련 포스트 바로가기)

3. 음성변환(Text to Speech, 관련 포스트 바로가기)

4. 디지털 휴먼(①볼류메트릭, ②모션캡쳐, ③CG, ④뉴럴 렌더링)

 

언어를 이해하고 생성하는 기술은 챗GPT를 기점으로 폭발적으로 성장하고 있으며, 음성을 말하고 인식하는 기술은 스마트폰와 AI스피커를 통해서 이미 상용화되어 있다.

 

디지털휴먼 기술은 아직까진 모델과 인플루언서에 머무르고 있지만, 불완전한 기술로도 이미 여러 기업들이 새로운 직원을 끊임 없이 만들어 내고 있으며, MR환경이 확대될 수록 최대한 인간처럼 보이는 유능한 디지털휴먼을 만들기 위해 투자를 아끼지 않을 것이다.

 

발전사항을 알아보기 위해 각 기술을 간략히 요약하면 다음과 같다.

 

1) 볼류메트릭 : 피사체를 360도로 촬영해 3D모델로 만드는 기술

2) 모션캡쳐 : 모델링된 개체로 표정이나 행동을 구성

3) CG :  3D모델을 자연스러운 2D이미지로 렌더링

 

최근 가장 중요한 변화는 위의 기술들이 AI를 활용한 뉴럴 렌더링(NeRF)기술로 인해 사진 몇 장만으로도 볼류메트릭과 모션을 생략한채 렌더링된 이미지를 빠르게 만들어낸 다는 것이다.

 

특히, 최근 사회적인 문제를 일으키고 있는 딥페이크도 뉴럴 렌더링 기술에 속할 정도로 저변화 되어있다.

 

국내에서도 이미 뉴럴 렌더링 기술을 이용하여 딥브레인AI, 마음AI(구 마인즈랩), 클레온 등의 업체에서 대기업과 협업하여 직원을 촬영한 후 디지털 휴먼을 만들고 있다.

 

다만, 아직까진 TV와 키오스크 속에서 사전에 녹화된 모습으로만 활동하고 있으며, 실시간 렌더링과 같은 기술을 꾸준히 고도화하여 메타버스와 XR(VR, AR, MR)환경에서 인간의 모습으로 활동할 준비를 하고 있다. 

 


728x90