인공지능의 활용도가 다각화되는 시대, AI의 영역은 어디까지 확장될지 그 귀추가 주목되고 있습니다.
특히 음성과 영상 분야에서의 AI의 활용도는 점점 더 높아지고, 우리 주변에서도 AI를 쉽게 만나볼 수 있습니다.
사람보다 자연스러운 AI 목소리의 등장
유튜브에서 영상 시청을 하다 보면 여러 채널의 내레이션 목소리가 같은 경우를 목격하신 적이 있을 겁니다.
한 사람의 성우가 여러 채널에서 활동을 하는지 의문을 가지셨겠지만, 사실은 AI 목소리입니다.
AI 목소리 만들기는 게임, 뉴스, 애니메이션, 교육 등 다양한 콘텐츠 채널에서 발견할 수 있는데요.
성우 대신 활용하고 집에서 쉽게 AI 목소리를 자유자재로 조절할 수 있다는 점에서 활용도가 높아진 것이죠.
특히 어느 누구든지 크리에이터에 도전하는 요즘, 자신의 목소리를 노출하지 않고도 시청자와 대화하듯 콘텐츠를 제작할 수 있어 많은 사람들이 찾고 있습니다.
간단한 AI 목소리 출력의 비결, TTS
그렇다면 AI 목소리는 어떻게 출력되는 걸까요? AI 목소리는 TTS 기술을 통해 만들어집니다.
TTS란 컴퓨터의 프로그램을 통해 사람의 목소리를 구현해내는 것을 뜻하며, 성우 없이도 거의 모든 단어와 문장을 쉽게 모사할 수 있다는 특징이 있습니다.
이세돌 9단을 이긴 알파고를 개발한 구글 딥마인드 산하의 웨이브넷은 머신러닝의 일종인 딥러닝 기반의 TTS 시스템을 제작한 바 있는데요. 연구를 거듭한 결과 성우가 직접 읽은 문장보다 더욱 자연스러운 문장을 구사할 수 있는 수준에 이르렀다고 합니다. 일반인을 대상으로 실험한 결과 어느 것이 성우의 목소리인지 구별하기 어려울 정도였다고 합니다.
음성합성 기반 서비스의 등장
이렇게 음성합성 기술을 기반으로 한 서비스들은 사람들에게 다양한 편의성을 선사하며 대중화되었습니다. 해외에서는 리드스피커나 브라우즈어라우드와 같은 웹기반 서비스 솔루션이 웹사이트를 읽어주는 TTS 프로그램으로 대중화되었고, 일본에서는 지방자치단체 홈페이지의 70% 이상이 TTS 음성 서비스를 제공합니다. 국내의 경우 지하철 신분당선에서는 TTS 목소리를 활용하여 안내 방송을 하고 있습니다. 여러 디스코드TTS 또한 사람들이 간단히 활용할 수 있는 밈이 되었고요. 수년 전만 해도 인공지능의 목소리는 사람의 목소리와는 분별력 있을 만큼 어색하다고 평가되었지만, 이제는 다릅니다. 사람이 말하는 문장의 높낮이, 감정, 길이까지 섬세하게 조정하여 소리로 출력할 수 있기 때문이죠.
집에서 쉽고 편하게 AI 목소리 만들기
그렇다면 누구나 인공지능 목소리를 자유자재로 활용할 수 있을까요? 정답은 ‘그렇다’입니다.
한국을 대표하는 AI 목소리 서비스 ‘타입캐스트’는 간단한 편집만으로 누구나 성우가 말하는 것 같은 퀄리티의 음성을 제작할 수 있는데요.
전문 성우가 녹음한 목소리를 기반으로 AI 목소리를 제작했기 때문에 감정 표현, 운율, 속도 조절까지 능숙합니다.
활용방법 또한 간단합니다.
텍스트로 된 문장을 입력한 후 원하는 AI 성우를 선택해 음성을 조절하면 되는데요. 음성 제작이 다 끝났으면 음성 파일을 통합본이나 문장별로 다운로드받을 수 있습니다. 현재 한국어, 영어, 일본어, 스페인어 네 가지 언어를 지원해 다국적으로 활용도 가능하며, 영어 더빙에 최적화된 AI 성우도 마련되어 있습니다.
타입캐스트는 AI 목소리를 사용하길 원하는 개인, 기업, 공공기관, 단체 등 누구나 쉽고 편리하게 사용할 수 있다는 특징이 있습니다.
AI 목소리에서 더 나아가 가상 인간까지
타입캐스트에서는 AI 목소리뿐만 아니라 가상 인간 비디오 기능을 이용할 수 있습니다.
원하는 가상 인간을 선택하여 비디오 파일을 저장해 여러 플랫폼에서 활용이 가능하며, 짧은 클립 공유로 게시물이나 타인에게 공유할 수도 있습니다.
실제로 타입캐스트의 가상 인간은 유튜브 숏츠나 틱톡 등 다방면에서 많이 활용되고 있습니다. 특히 사용자가 작성한 문장에 맞춰 얼굴 표정이 변화하고, 입 모양도 문장에 맞춰 달라집니다.
타입캐스트의 가상 인간 유나가 등장하는 유튜브 콘텐츠
타입캐스트는 자연스러운 음성 표현을 위해 말하는 속도, 끊어서 말하기, 목소리별 스타일 변동, 다양한 감정 추가 등 여러 가지 옵션을 제공해 사람보다 더 사람 같은 AI 목소리와 가상인간 서비스를 제공하고 있습니다.
이러한 AI 목소리와 가상인간 서비스는 평소 좋아하는 책이나 영화 및 드라마 각본, 영상에 더빙할 대본 등 무궁무진한 주제로 나만의 오디오·비디오 영상 콘텐츠를 제작할 수 있다는 편리함이 있습니다.
특히 스튜디오가 아닌, 방 안에서도 쉽게 가상 인간과 AI 목소리를 다재다능하게 활용할 수 있다는 점은 누구나 전문적으로 콘텐츠를 제작할 수 있게끔 하는 큰 동력이 됩니다.