글꼴과 말꼴. 글씨를 못 써도 괜찮아, 목소리에 자신 없어도 괜찮아.
지금에야 누구나 하다못해 페이스북 담벼락에라도 얼마든지 글을 써서 전 국민 아니 전 세계로도 보낼 수 있다. 글만 정말 좋다면 입소문에 의해 순식간에 전국구가 될 수도 있다. 현실은 어떨지 모르겠지만 적어도 이론상으로는 그렇게 글쓰기는 민주화가 이뤄졌다.
하지만 예전에는 잡문(雜文)조차 아무나 쓸 수 있는 일이 아니었다. 수필가라는 직업이 따로 있었을 정도였다. 문단의 심사위원과 출판사가 예쁘게 봐주지 않으면 내 글은 영원히 서랍 속에 있어야만 했다. 그런데 요즈음은 블로거라는 말도 낯뜨거운 말이 되었다. 글 따위야 누구라도 쓸 수 있는 것이라서다.
화면 위의 글꼴, 즉 폰트는 아무나 쓸 수 없었던 활자를 대중화해줬다. 지금은 손끝의 터치만으로 조판과 식자를 순식간에 할 수 있다. 미려한 글꼴로 바뀌니 의식의 흐름조차 그럴듯해진다.
어쨌거나 육필로는 도저히 귀찮아서라도 기록되지 않았을 수많은 생각의 조각들이 깜빡이는 커서 뒤에서 지금도 손쉽게 글꼴에 의해 조립되고 있다.
마찬가지의 일이 문자가 아닌 구술문화에서도 재현될 듯하다. 이미 유튜브로 대변되는 신구술문화는 세대를 막론하고 급속히 퍼져나가고 있다. 점점 읽는 것보다 보고 듣는 것이 편해진다. 아니 원래 더 편했었을 것이다.
하지만 인터넷은 방송이라는 거대 배포형 장치산업은 대체할 수 있어도, 그 안의 캐릭터만큼은 대체하지 못했다. 아무리 좋게 봐주려 해도 시청각에 특화되지는 않은 외모와 목소리를 가진 이들이 유튜브에 등장하곤 한다. 독창적 콘텐츠를 가지고 있음에도 불구하고 익숙하지 않고 낯선 캐릭터를 시청자는 받아들이기 힘든 탓인지 아쉽게도 인기를 얻지는 못한다. 악필로 쓴 연습장의 문장과 곱게 인쇄된 문장은 전혀 다른 느낌의 문장이 되는 것 같은 이치인가 보다.
그러나 마치 글꼴이 세상의 모든 악필을 중화시켰듯이, 인공지능 합성 기술은 시청각의 어설픔을 미화시킬 수 있다. WellSaid라는 스타트업의 음성 합성을 보면 거의 사람이 읽는 듯한 자연스러움으로 음성을 합성해 준다. 이런 기술과 함께라면 토종인 나도 내일부터 네이티브 스피커다.
사실 딥러닝 기반의 음성합성은 때로는 놀라운 자연스러움을 자랑하는데, 이미 딥페이크의 데모들로 국내에서도 전현직 대통령을 흉내 내는 일이 화제가 된 적이 있다.
이제 텍스트 파일만 있다면 이를 이병헌이나 아이유의 목소리처럼 친근감 있는 배우의 목소리를 학습시켜 만든 인공지능 음성합성에 의해 재생할 수 있게 된다.
글꼴 대신 ‘말꼴’의 시대가 열리고 있다.
그런데 그냥 글로 읽으면 그만인데, 왜 꼭 굳이 보고 들으려 할까. 인류가 문자를 발명한 것은 겨우 기원전 3천 년 전. 길고도 긴 진화의 과정 동안 문자 대신 사람의 얼굴을 보고, 사람의 입에서 나오는 주파수를 들으며 살아온 시간이 더 길어서일 터다.