AI음성인식 기술은 기술과 라이브러리가 공개되어 있고 데이터도 공개되어 있는 편이라 비교적 쉽게 만들 수 있는 AI에 속한다.
그래서 관련 스타트업도 많고 시중에 이런 저런 앱들도 출시되어 있지만, 앞서 포스트(관련 글 바로가기)에서도 언급하였듯이 말의 늬앙스와 소음 등에 영향을 받기 때문에 좋은 성능을 가진 AI를 만들기는 쉽지 않다.
인간이 그렇듯이 AI도 어떠한 교재와 데이터로 학습하는 지에 따라 전문성이 달라지며, 대기업제품(구글, 애플, 네이버 등)이 만든 모든 분야에서 좋은 성능을 내야 하는 AI들은 특정분야에서 오히려 성능이 떨어지기도 한다.
오늘 소개하려고하는 AI도 대기업제품 못지 않은 성능을 가졌다는 이야기를 듣고 응원하는 마음에 테스트도 해볼 겸 포스팅을 작성해본다.
Vrew 이용방법
Vrew(브루) 홈페이지 주소는 다음과 같다. 도메인에 보듯이 보이저엑스라는 이름의 스타트업이 만든 제품으로 해당 기업의 소개에 들어가보면 모바일 스캐너(OCR)와 폰트(?)도 소개되어 있다.
첫화면에 무료다운로드를 누르면 윈도우앱을 다운받을 수 있으며, 앱스토어에 들어가면 스마트폰 앱도 제공하지만, 오늘은 테스트라는 목적에 맞게 웹에서 체험하기를 바로 눌러보자.
본 화면에는 영상과 스크립트가 입력된 화면이 보이고 메뉴에는 클립 합치기 등이 보이며, 간단한 편집 기능들을 제공한다.
좌측 상단의 새로 만들기를 클릭하면 아래와 같이 여러가지 기능과 함께 영상을 가져올 수 있다. 크게 표시된 영상 및 음성 파일로 시작하기를 누르면 앱 설치를 권하는 화면이 나오니 우측에 있는 녹화 및 녹음하기를 눌러서 영상을 가져와 보자.
녹화할 화면을 선택하라는 버튼을 클릭하면 브라우저의 탭과 Window 프로그램을 선택할 수 있다.
로컬에 저장해둔 강의 영상을 선택한 후 Vrew의 녹화버튼과 함께 미디어 플레이어를 재생하면 실시간으로 재생되는 영상과 음성을 가져올 수 있다. (동영상을 재생하지 않고 가져오는 기능은 프로그램을 다운받아야 하는 것으로 보임)
가져오기가 완료되면 녹화된 영상과 스크립트가 표시되는데 단어별로 쪼개진 스크립트에 마우스를 갖다대면 해당 화면도 나타나서 영상에 자막을 달기에 정말로 유용해 보인다!
스크립트는 직접 수정할 수도 있으며 자막에 적용된 서식도 바꿀 수 있다.(왜 폰트를 제공하는 알게됨)
유튜브가 달아준 자막과 비교했을 때 음성인식 기능이 상당히 훌륭함을 알고 있으며, 자막을 편집하여 영상에 직접 포함시킬 수 있으니 영상작업 시 상당히 유용해보인다.
성능 테스트
더 많은 기능들을 이용해보고 싶었지만, AI툴 리뷰가 목적이니 얼마나 인식이 잘되는지 속사포랩으로 테스트를 해보자!
앞서 사용했던 녹화 및 녹음하기 버튼을 누른 후 브라우져에서 유튜브를 선택하면 된다.
테스트에 사용한 유튜브 영상은 아래와 같다.
누가 한국에서 가장 빠른 래퍼일까? V4 :: 아웃사이더 vs 조광일 vs 조우진 vs 케이케이 vs 아이닐 vs 저스디스 - YouTube
???
속사포랩을 인식하지 못한다고 VREW가 성능이 안좋은건 아니다. A사의 음성메모도 N사의 **노트도 인식을 못하니... 이건 인간이 미안.... 아니 음성인식은 역시 전문 분야별 추가학습이 필요해 보인다.
'유용한 TIP' 카테고리의 다른 글
글쓰기에만 사용하긴 너무 아까운 노션 AI (50) | 2023.06.24 |
---|---|
챗GPT로 동작하는 AI툴을 만들어보자! 뤼튼 스튜디오 (62) | 2023.06.22 |
AI툴 소개 및 랭킹 사이트 3곳 (34) | 2023.06.18 |
무료 AI이미지 생성 후 디자인에 바로 활용 - CANVA (46) | 2023.06.14 |
GPT4.0을 이용한 국내 AI 인터페이스 - 뤼튼(wrtn.ai) (29) | 2023.06.12 |