검색
[투자]by 넘버스

많고 많은 AI 기업, ‘스켈터랩스’의 경쟁력은 뭘까

많고 많은 AI기업. 다들 기술적으로 뛰어난 성과를 갖고 있다고 하는데요. AI 기술 기업 ‘스켈터랩스(Skelter Labs)’와도 이야기를 나눠봤습니다. 특히 대화형 AI 서비스를 제공하는 기업이 가진 기술과, 성과 지표 등을 어떻게 봐야 하는지 조금은 알 수 있었습니다.

????당신에게 들려줄 이야기

- 왜 대화형 AI일까, 커지는 AICC 시장

- 챗봇이 나를 화나게 하는 이유

- 스켈터랩스의 기술, 그 조합으로 나올 수 있는 서비스

- 기계독해 성능 평가 결과 ‘코쿼드’를 이해하는 방법

- 범용AI의 한계, 스켈터랩스가 하려는 것

- 스켈터랩스가 만들려는 휴먼AI

- AI 제품은 왜 만들기 어려울까

- AI 성능을 고도화하는 데 중요한 것

 

(왼쪽부터) 김도연 제품·서비스총괄, 서종훈 기술·연구총괄 (사진© 스켈터랩스)

 

AI(인공지능) 관련 기업, 참 많은데요. ‘스켈터랩스(Skelter Labs)’는 다른 회사의 ‘대화형 AI’를 만들어주는 회사입니다. (참고로 AI 챗봇 ‘이루다’를 만든 ‘스캐터랩’과 다른 회사입니다.)

​대화형 AI는 기계가 인간과 대화할 수 있게 만드는 기술인데요. 해당 기술이 적용된 대표적인 서비스로 채팅 로봇인 ‘챗봇(Chatbot)’을 들 수 있습니다.

​스켈터랩스 김도연 CPO(제품·서비스 총괄), 서종훈 Head of Engineering(기술·연구 총괄)을 만났는데요. 대화형 AI 기술의 경쟁력, 관련 시장에 대해 듣고 왔습니다.

 

|스켈터랩스가 ‘대화형 AI’에 집중한 이유

먼저 스켈터랩스는 왜 대화형 AI에 집중했을까요? 2015년 설립된 스켈터랩스는 작년까지만 해도 대화형 AI 외 비전 AI 등 다양한 AI 관련 기술들을 연구해왔습니다. 하지만 아무리 좋은 기술이 있다 해도 제품화가 되지 않으면 의미가 없을 수 있다고 판단했고, 대화형 AI를 제품화하기로 한 건데요.

 

대화형 AI가 현실적으로 임팩트를 줄 수 있는 분야라고 생각했어요. 사실 AI라는 게 굉장히 뜬구름 잡는 소리가 많잖아요. 그래도 대화형 AI 분야는 실생활에서 쓰일 수 있기 때문에 효과를 보여줄 수 있죠. (김도연)

 

AI는 범위가 넓죠. 대화형 AI는 그 가운데 실제로 워킹(작동)하고 있는 모델을 보여주고 있는 분야고요. 시장에서 증명이 좀 된 분야고, 관련 시장이 많이 커졌죠. 기업들의 니즈가 늘어나고 있는 게 눈에 보여요. (서종훈)

 

스켈터랩스의 대화형 AI 기술을 적용한 서비스는 ①고객이 직접 구축하는 대화형 AI 플랫폼 ‘AIQ.TALK’ ②스켈터랩스가 직접 대화형 AI 솔루션을 구축해주는 ‘AICC(인공지능컨택센터)’ ③디지털 휴먼인 ‘휴먼AI’ 등입니다.

​즉 다양한 기업이 스켈터랩스의 기술을 기반으로 한 챗봇이나 콜봇 등을 만들 수 있게 한 건데요. 정리하면 스켈터랩스의 대화형 AI 기술이 있고, 이를 소프트웨어 형태로 내놓은 것이 AIQ.TALK, 이 안에 있는 기술을 적용해 또 서비스하는 분야가 AICC와 휴먼AI인 겁니다.

​특히 스켈터랩스는 AICC 시장이 커질 것으로 보고 있는데요. 현재 대화형 AI 시장에서 가장 비중이 큰 시장이고(업계에 따르면 60~70%가 AICC), 실제 많이들 진출해 있는 시장이죠.

​기업의 니즈가 높은 건 실제 돈을 쓴 만큼 현재 효용을 보고 있기 때문인데요. 상담 등을 제공하는 고객 서비스센터에 많이 쓰이죠. 관련 인력에 들어가는 비용을 줄일 수 있습니다. 하지만 단순 비용 절감 말고 부가가치를 제공할 수 있는 것들도 꽤 있다고 하는데요.

 

STT(음성인식기술)를 이용해 상담사들에게 부가적인 정보를 제공해 상담하는 과정에서 좀 더 빠르게 대응이 되도록 한다든가, 텍스트에서 문제가 되는 것들을 필터링하고 제공해준다든가 하는 식으로 서비스적인 부가가치를 높이고 있습니다. (서종훈)

 

AICC 구축 개념도. (사진© 스켈터랩스)

 

|내가 만난 ‘챗봇’은 왜 답답할까

그런데 기업이 챗봇을 많이 활용한다고 해서, 그 챗봇을 쓰게 되는 고객이 다 만족하는 건 아닐텐데요. 개인적으로 전 챗봇이 답답합니다. 저 같은 고객이 느끼는 답답함은 어디서 비롯되는 걸까요? 챗봇의 성능은 어떻게 판단할 수 있을까요?

 

챗봇이 모든 상담을 100% 커버한다고 하면 아직 가야할 길이 너무 멀고요. AI가 지금 커버하고 있는 건 상담사들의 막일을 줄여주는 거죠. 간단한 답변으로 충분한 것들을 빠르게 대응할 수 있게 하고요. (서종훈)

 

그것도 문화별, 세대별로 다 다르더라고요. 대면 커뮤니케이션에 대한 거부감을 가지고 있는 사람들 있잖아요. 그런데 챗봇은 빨리 대답해주고 뭔가를 해야 한다는 압박도 받지 않아요. 다 선호도 차이죠. (김도연) 

 

사실 기업의 니즈가 높긴 하지만, 대화형 AI 자체의 기술적 과제는 아직 많다고 합니다.

 

사람들마다 말하는 게 되게 다양하잖아요. 우리나라 말은 사투리도 있고요. 그런 걸 다 지원해서 높은 성능을 내야 하고요. 또 커뮤니케이션을 하는 거다 보니 조금만 성능이 좋지 않아도 ‘이거 별로다’라는 피드백으로 바로 연결이 돼요. 다른 서비스로 갈아타게 되죠. 어려운 분야예요. (서종훈) 

 

성능 지표도 딱 명확하게 볼 수 있는 분야는 아니라고 하는데요. 이는 ‘데이터셋(자료의 집합체)’과 관련 있습니다.

​쉽게 말해 AI 성능을 비교해 순위를 매기기 위해선 알고리즘도 중요하지만, 그 전에 AI가 학습하는 데이터셋이 모두 같아야 합니다. 공정하게 같은 시험 문제(데이터셋)를 가지고 풀어야 하는 거죠. 그러려면 기준이 될 벤치마크 데이터셋이 있어야 하는데요.

 

챗봇은 딱히 벤치마크 데이터셋이 있는 분야가 아니에요. 그래서 뭔가 공인된 성능 측정 결과가 나오지 못하는 분야고요. 예를 들어 비전 AI 같은 경우 워낙 역사가 오래됐다 보니까 공인된 데이터셋이 꽤 많죠. 그리고 또 한국어 자체도 공인된 데이터셋이 많지 않아요. (서종훈)

 

|스켈터랩스의 기술 경쟁력?

그렇다면 스켈터랩스는 왜 자사의 대화형 AI 기술력이 뛰어나다고 하는 걸까요?

​일단 스켈터랩스의 대화형 AI 하위 기술은 ①자연어 이해(NLU) ②음성인식(STT) ③음성합성(TTS) ④기계독해(MRC), ⑤자연어 생성(NLG) 등으로 나뉩니다. 그리고 일반적으로 이 모든 기술 부문에서 높은 성과를 내는 게 쉽지 않은데, 스켈터랩스는 모두 최고의 기술적 성과를 가지고 있다고 자부하죠.

 

대화형 AI라고 했을 때, 사람이 말하는 걸 들어서 데이터화(STT)하고, 그걸 이해해(NLU) 사람 목소리로 내보내고(TTS) 등등 이 과정이 길잖아요. 근데 이 모든 하위 기술에 대해 원천 기술을 가지고 계속 개선하는 회사는 많지 않아요. 어느 특정 분야 기술만 가지고 있어 컨소시엄 형태를 많이 꾸리죠. 그런데 저희는 전체적으로 좋은 기술 수준을 유지하고 있다는 게 큰 장점이라고 생각해요. (김도연)

 

기술 수준과 관련해 대외적으로 보여줄 만한 순위가 있긴 한데요. ‘기계독해’ 분야에서요. ‘코쿼드(KorQuAD)’ 성능 평가 결과입니다. 코쿼드는 ‘LG CNS’가 만든 자연어 이해 학습용 한국어 표준데이터셋입니다.

​스켈터랩스는 2020년 코쿼드 1.0 성능 평가에서 F1 스코어(코쿼드 순위 지표인 정답률 측정 점수) 95.15점으로 1위, 같은 해 또 코쿼드 2.0 성능 평가에서 F1 스코어 88.09점을 받으면서 1위를 기록했는데요. 하지만 현재는 모두 순위가 떨어진 상태긴 합니다. 코쿼드 순위, 어떻게 봐야 할까요?

 

코쿼드 2.0 순위(정답률 기반). (사진© 코쿼드)

 

일단 저희는 성능이 어디까지 나오는지 한 번 해보자 해서 1등을 찍은 거고, 그 이후로는 그 데이터에 대해서 관리를 하진 않고 있고요. 일반적으로 인력이 많은 큰 조직들은 순위를 유지할 수 있게 관리를 하기도 하죠. (서종훈)

 

그런데 더 살펴보니, 여전히 스켈터랩스가 1위를 유지하고 있는 부문도 있었는데요. 지연속도(1-example Latency)를 가지고 순위를 매긴 겁니다.

 

코쿼드 2.0 순위(속도 기반). (사진© 코쿼드)

 

샘플 하나를 눌렀을 때 어느 정도 속도냐 하는 건데, 속도 측면에선 그래도 저희가 괜찮은 모델을 가지고 있는 거죠. 물론 정확도는 77% 정도라 높지 않은데, 저희 기준에선 80%는 넘어야 사용해볼 만한 걸로 보고 있어요. 정확도 측면에서 순위가 매겨진 모델들은 성능은 좋지만 필드에 적용하기엔 무거운 모델들이기도 하죠. (서종훈)

 

그리고 실질적으로 B2B(기업 간 거래) 영업을 하다 보면 고객마다 속도, 성능, 비용 등 선호하는 부분이 다 달라요. (김도연)

 

물론 그 외 기술들도 다른 회사와 겨뤄볼 기회가 있긴 한데요. 벤치마크테스트(BMT)라고 해서 같은 데이터셋을 가지고 하는 겁니다. 그때의 결과들을 가지고 고객사로부터 수주를 하기도 합니다. STT 같은 경우 특히 그렇다고 하네요.

 

|‘범용AI’와 다른 길을 간다?

스켈터랩스가 차별점으로 내세우는 것이 또 있는데요. 범용AI가 아니라는 것입니다. 일반적으로 모델이 크면 클수록 정확하지만 느려진다고 하는데요. 이러한 무거운 모델이 목표로 하는 건 대개 범용AI입니다.

​초거대AI가 해당하는데요. 어떤 질문이 들어와도 적당하게 대답할 수 있는 성능 좋은 범용 서비스를 만드는 겁니다. 그만큼 많은 데이터를 쏟아부어야 하고요. 인력과 비용이 많이 듭니다. 큰 회사들이 할 수 있겠죠.

​범용AI에게 한계점으로 지적되는 게 있는데요. ①수정하기 힘들다는 점, ②특정 영역의 비즈니스에 바로 붙여 활용되기 쉽지 않다는 점 등입니다.

​좋은 예가 있는데요. 요즘 이슈가 되고 있는 AI 챗봇 ‘챗 GPT(ChatGPT)’입니다. ‘오픈AI(OpenAI)’에서 만든 건데요. 오픈AI는 일론 머스크 테슬라 CEO(최고경영자) 등 실리콘밸리 기업가들이 AI 기술을 무료로 공개하고 연구하기 위해 만든 기관입니다.

​챗 GPT에게 ‘한국의 대통령은 누구야?’라고 물었더니 ‘박근혜입니다’라는 답이 돌아왔습니다. (다음 날 해보니 김정은이라네요.)

 

2022년 12월 15일에 물었을 때. (사진© 챗 GPT)

 

2022년 12월 16일에 물었을 때. (사진© 챗 GPT)

 

아마 걔가 학습했을 때 그런 데이터가 많았으면 그랬을 거예요. 문제는 그런 것들을 갱신하고 필터링하기 어렵다는 거죠. 모델이 크다보니까요. 그래서 챗봇이 한 대답의 신빙성이 문제가 될 수 있어요. (서종훈)

 

스켈터랩스는 범용AI와 같은 제너럴리스트보다 ‘스페셜리스트AI’로 나아간다는 방향성을 잡았는데요. 대규모 불특정 데이터를 학습시키는 것보다 전문성을 갖춘 데이터를 학습시켜 좀 더 비즈니스적으로 접근해 서비스를 한다는 겁니다. 다양한 특정 영역의 비즈니스에 활용될 수 있게 한다는 거죠.

​스켈터랩스의 대화형 AI는 3가지 스킬을 가지고 있는데요. ①기계독해 기술을 적용한 ‘질의 응답 챗봇’(지식) ②이용자와 감정적·일상적 대화가 가능한 ‘오픈 도메인 챗봇’(공감능력) ③예약이나 날씨 확인 등 이용자의 일을 대신해줄 수 있는 ‘목적 지향형 챗봇’(효용성) 등입니다.

​그리고 각 대화 스킬을 목적과 의도에 맞게 전환할 수 있는 ‘다이얼로그 매니저’ 기술을 보유하고 있는데요. 쉽게 말해 AI랑 수다 떨다가 갑자기 식당 예약 좀 해달라고 주문할 수 있는 겁니다. 자연스러운 전환이 일어날 수 있도록 하는 거죠. 일반적으로 다른 서비스들은 각각의 스킬만을 서비스할 수 있는 형태라고 합니다.

​초거대 AI도 방향성 자체는 자연스런 대화가 이뤄지도록 하는 것인데요. 때문에 목표를 향해 가는 방법이 다르다고 보면 됩니다.

​스켈터랩스는 각 영역마다 자연스런 대화가 가능하도록 훈련을 시켜 연결하려는 그림을 그리고 있는 셈인데요. 모델이 작기 때문에 특정 영역마다 좀 더 믿을 만한 고품질 데이터를 제공하고 갱신하며 최적화하는 데에 상대적으로 수월하다고 합니다.

 

뭐가 좋고 나쁘다기보다 사실 90%의 사람을 60% 정도 만족시키느냐, 20~30%의 사람들을 90% 만족시키느냐의 차이라고 생각해요. (김도연)

 

저는 ‘자비스’를 만들고 싶어요. 많이 언급되는 디지털 휴먼이 ‘사만다’와 자비스인데요. 사만다는 되게 감정적이고 우리에게 필요한 걸 채워주는 건 아니죠. 감성에 대한 해소를 해주는 모델이고요. 자비스는 우리에게 필요한 걸 제공해주는데, 여기에 공대생 유머 정도? 쓸데없는 소리도 좀 적당히 할 줄 아는 친구를 만들고 싶어요. 인터랙션(interaction)이 잘 되는 그런 친구요. (서종훈)

 

|‘휴먼AI’는 어떻게 활용될까

 

 

????넘버스 멤버스는 당신이 궁금한 기업을 기자가 Digging합니다. ????

 

투자자 유의사항: 이 콘텐츠에 게재된 내용들은 작성자의 의견을 정확하게 반영하고 있으며, 외부의 부당한 압력이나 간섭 없이 작성되었음을 확인합니다. 해당 글은 필자가 습득한 사실에 기초하여 작성하였으나, 그 정확성이나 완전성을 보장할 수 없으므로 참고자료로만 활용하시기 바라며, 투자 시 투자자 자신의 판단과 책임 하에 최종 결정을 하시기 바랍니다. 따라서, 해당 글은 어떠한 경우에도 투자자의 투자 결과에 대한 법적 책임소재의 증빙자료로 사용될 수 없습니다.

 

오늘의 실시간
BEST

invest_51
채널명
넘버스
소개글
現) 블로터 사내 스타트업 ‘투자 리터러시 플랫폼' 기업·경제·기술 이야기를 숫자로 풀어씁니다. 문병선·이일호·황금빛 기자가 투자자를 위해 상장과 비상장 기업의 가치평가를 탐구한 콘텐츠를 서비스합니다.