TTS의 정의와 적용 현황 음성 합성(Speech synthesis 또는 Text To Speech) 기술이란 인간의 말소리를 합성하는 기술로서 텍스트를 입력하면 음성의 발음, 속도, 호흡, 운율 등을 추정하여 녹음해둔 음성을 조합하거나 생성하는 기술이다. 1930년대 텍스트를 입력하면 이에 맞춰 피아노를 동작시키는 아이디어에서 시작하여 80년대부터 본격적으로 상용화되었으며 90년대에 이르러서는 음성 인식(STT, Speech To Text)과 더불어 활용도가 넓어지기 시작하였다. 초기에는 시각장애인을 위한 기술 위주로 시작하였으나 상용화되면서 안내 음성, ARS 등 기계음의 영역에서 이용되었으며, 현재는 AI를 기반으로 자연스러운 음성을 만들어짐에 따라 오디오북, 게임, AI앵커 등과 같은 성우의 역할..