"한국어 변주 많아 욕설 걸러내기 힘들어... AI 발전하면 댓글창 다시 열 수도"
(2)악플과의 전쟁, 최전선에 선 AI
네이버 AI클린봇 개발자들 인터뷰
네이버에서 AI클린봇2.0을 개발한 이규호(왼쪽) 네이버 이용자피드백플랫폼팀 리더와 황태현 뉴스서비스 미디어운영팀 매니저. 네이버 제공 |
아무리 좋은 방패를 마련해도 이를 뚫을 수 있는 날선 창은 나오기 마련이다. 기업들이 걸러내고 또 걸러내도 진화된 악플은 인터넷 세상을 더럽힌다. 그렇다고 손 놓고 구경할 수만은 없는 일. 한 쪽에선 끊임없이 더 강한 방패를 만들기 위해 인공지능(AI) 알고리즘 개발에 매진하고 있다.
대표적인 이들이 네이버의 '악플 청소부'를 만드는 10여명의 개발자들이다. 황태현 네이버 뉴스서비스 미디어운영팀 매니저는 "악플에 대한 사람들의 민감도가 점점 강해지고 있고, 그에 따라 저희에게 요구되는 수준도 높아지고 있다"며 "이용자들을 만족시키기 위해선 이전보다 효과적인 해법이 필요하다고 판단했고, 그 중 하나가 악플만 가려주는 'AI 클린봇'이었다"고 설명했다.
올해 6월 네이버가 약 8개월 간의 개발 끝에 선보인 'AI 클린봇 2.0'은 기존 AI 클린봇 대비 악플 처리량이 2배가량 증가했다. 단어가 아닌 문장을 읽고 악플 여부를 판단하기 시작했기 때문이다. AI 클린봇 2.0 개발을 이끈 이규호 네이버 이용자피드백플랫폼 리더는 "기존에는 욕설 데이터베이스(DB)를 기반으로 정확히 맞아떨어지는 단어를 걸러내는 방식을 썼는데, 사람들이 한자, 숫자, 영어, 일본어, 이모티콘까지 동원해 욕설로 만들어내자 한계가 분명해졌다"며 "전체적으로 문장을 읽어내 '의도'를 찾아낼 수 있는 AI 모델을 만들기 위해 노력했다"고 설명했다.
그 결과 이전에는 걸러낼 수 없었던 모욕적 표현과 성희롱 등 다양한 악플이 자동으로 가려지고 있다. 예를 들어 과거에는 '개'가 들어가는 욕설을 정확히 적어야지만 클린봇이 인식했다면, 이제는 '7H'와 같이 우회적인 단어 표현에도 AI가 욕설로 알아차리게 되는 방식이다. 맥락상 모욕일 경우에도 이제 AI가 알아차린다. 이 리더는 "가령 '쓰레기'라는 단어도 어떻게 쓰이냐에 따라 욕설일 수도, 아닐 수도 있다"며 "AI가 학습을 거듭하면서 이런걸 구분해낼 수 있을 정도로 점점 똑똑해지고 있다"고 말했다.
올해 6월 업그레이드된 네이버의 'AI클린봇2.0'이 걸러낸 '욕설 맥락' 댓글들. 기존에는 걸러내지 못했던 다양한 변형 욕설들을 모두 가릴 수 있게 됐다. 네이버 제공 |
문제는 끊임없이 변하는 언어다. 한국어의 경우엔 자체적인 변화가 빠르고 다양한 데다, 한글이란 문자 자체도 다양한 형태로 변조가 쉽기 때문에 욕설과 악플을 걸러내는 입장에선 골머리가 아프다. 이 리더는 "과거에는 의미가 괜찮았던 단어가 요즘 나쁘게 쓰이기도 하고, 반대로 과거 폄하의 의미였던 말이 이제 애정어린 말로 여겨지기도 한다"며 "예를 들어 '꼰대'라는 말은 과거엔 욕설에 가까웠다면 이제는 상대적으로 유머러스하게 표현되기도 하는데, 이런 부분을 지속적으로 쫓아가고 해결해나가는 게 우리로서는 어려운 일"이라고 토로했다.
이들이 개발하는 다음 단계 AI는 문장을 넘어 본문 기사나 동영상 내용까지 연계해 맥락을 파악하는 기술이다. 예를 들어 '쓰다듬고 싶다'는 댓글은 귀여운 아기 동물이 등장하는 동영상에 달렸을 때와 노출 있는 의상을 입은 사람이 출연하는 동영상에 달렸을 때 그 의도가 다르게 읽힌다. 이 리더는 "사람은 댓글을 보자마자 바로 그 의도를 알아챌 수 있지만, AI는 아직 콘텐츠와 댓글 사이의 맥락까지는 이해하지 못한다"며 "앞으로 콘텐츠와 댓글의 상관관계까지 AI가 잡아낼 수 있다면 더 많은 악플을 걸러낼 수 있을 것"이라고 전했다.
AI 수준이 한 단계 더 올라선다면 현재 굳게 닫혀있는 연예뉴스나 스포츠뉴스 댓글창은 열릴 수 있을까. 황 매니저는 "완벽하게 모든 악플을 제어할 수 있을지는 아직 결과물이 없기 때문에 확신할 수는 없다"며 "기술이 발전해 사회적으로 수용할 수 있는 수준이 된다면 논의와 토론을 거쳐 (댓글창 폐쇄 조치를) 재고할 수도 있을 것"이라고 내다봤다.
곽주현 기자 zooh@hankookilbo.com