Kaggle : 데이터 과학자들을 위한 공유경제 플랫폼
구글의 인공지능 관련 스트타업들에 대한 공격적인 인수는 그 속도와 규모 면에서 압도적이다. 구글은 최근 "그레디언트 벤처스(Gradient Ventures)”라는 인공지능 전문 투자펀드를 설립하였고, 이 투자사를 통해 올해만 10여개 인공지능 스타트업에 최대 1억2천만불(한화 약1400억원)을 투자할 계획이다.
구글이 인수한 많은 인공지능 스타트업들이 있지만, 올해 3월에 인수한 캐글(Kaggle)에 대해서 눈여겨 볼 필요가 있다.
구글의 캐글 인수가 특별한 의미를 가지는 이유는 그동안 구글이 해온 핵심 기술이나 핵심 인력에 대한 인수가 아닌 커뮤니티 네트워크까지 인수의 대상으로 포함시켰다는 점 때문이다.
구글은 왜 캐글을 인수했을까?
첫 번째는 인공지능, 특히 데이터 과학자를 채용하는 일이 구글도 쉽지 않은 일이기 때문이다. 그들의 역량을 검증하는 것도 많은 비용과 시간이 소모된다. 캐글은 60만명의 데이터 과학자가 활동하고 있는 커뮤니티이며, 채용을 하지 않더라도 그들과의 협업이 가능하다는 점이라는 장점을 갖는다.
두 번째는 크라우드소싱 플랫폼 효과를 활용하고자 하는 목적 때문이다. 최고의 데이터 과학자 인재들이 활동하는 커뮤니티 공간에서 구글이 제시하는 도전적인 과제를 통해서 원하는 목적을 달성할 수 있을 것이다.
세 번째는 구글의 인공지능 플랫폼인 텐서플로우(Tensor Flow)의 대중화 때문이다. 아마존, 마이크로소프트 등 경쟁사들보다 먼저 개발자들을 확보하겠다는 의도다. 구글이 텐서플로우를 오픈소스에 공개한 것은 더 이상 알고리즘이 인공지능의 경쟁력이 아니라는 것을 보여준다. 핵심 경쟁력은 데이터셋과 모델링에 있고, 이 역할을 수행하는 사람이 데이터 과학자들이다.
결국 구글이 캐글을 인수한 목적은 더 많은 데이터 과학자들이 텐서플로우를 활용하도록 하기 위함이다.
캐글에 대해서 좀 더 알아보자
캐글은 2010년 앤서니 골드블룸(Anthony Goldbloom)이 넷플릭스(Netflix) 경연 모델을 본떠서 데이터 과학자를 위한 온라인 커뮤니티를 창업하였다. 데이터 과학자로 구성된 크라우드소싱(Crowdsourcing)을 기반으로 방대하고 복잡한 인공지능 문제를 온라인상에서 해결하는 것을 목표로 한다.
이 커뮤니티를 통해서 기업들은 자신들이 해결하고자하는 인공지능 과제의 데이터셋을 제공하고 경연(Competition) 형태로 진행된다. 전세계 데이터 과학자들은 이 경연을 통해서 최고의 알고리즘 또는 모델을 개발하여 상금을 차지한다. 데이터 과학자들에게 상금의 규모가 중요한 것은 아니다. 캐글의 리더보드(Leaderboard)에 자신의 이름이 올라가는 것만으로 엄청난 명예와 권위를 인정받는다.
캐글의 창업 모델이 되었던 넷플릭스 사례는 아직도 많은 이들에게 세기의 매치로 회자되고 있다. 2006년 넷플릭스는 자사의 추천시스템인 시내매치(Cinematch) 알고리즘의 성능을 10% 이상 향상시킨 사람에게 100만달러 상금을 지급하겠다고 광고하였다. 이 이벤트는 3년간 150개국에서 20,000개 이상의 팀들이 참여하여 스타트업계 뿐만 아니라 전세계 IT 업계에 화제가 되었다.
캐글은 크라우드소싱인가 공유경제인가?
인공지능 및 머신러닝을 활용하여 자사의 서비스를 개발하고자 하는 기업의 대부분이 아직은 테스트 단계에 있다. 또한 인공지능 서비스를 도입하고자 하는 기업들은 어디서부터 시작해야도 될지도 모르는 경우가 많다. 다만 데이터 과학자부터 확보해야 된다는 사실 정도만 알고 있을 뿐이다.
문제는 한두 명의 데이터 과학자를 채용한다고 기업이 가지고 있는 과제를 해결할 수는 없다는 데에 있다. 이런 현실에서 캐글이 보유한 최고의 데이터 과학자 인재들을 활용하는 크라우드소싱 방식은 최소의 비용으로 최대의 효과를 가져올 수 있는 유일한 방법이다.
물론, 캐글이 보유한 60만명의 데이터 과학자들이 캐글을 위해서 일하는 직원들은 아니다. 이들은 캐글에서 자신들의 잉여시간을 활용하여 새로운 가치를 만들어내고 있다. 이런 측면에서 보면 캐글 사업모델은 공유경제 철학과도 일치한다.
공유경제 플랫폼은 사물, 공간, 서비스 공유 단계에서 지식 공유로 발전하게 된다. 그동안 “유데미(Udemy)” 같은 지식 연계 기반 교육 모델이 지식 공유 플랫폼을 대표했다면, 앞으로는 캐글과 같은 크라우드소싱 기반의 지식 공유 플랫폼이 주도하게 될 것이다.
국내에서도 캐글과 같은 데이터 과학자들을 위한 커뮤니티가 생기길 바라며, 언젠가는 캐글의 리더보드에도 한국인 이름이 상위에 랭크되길 기대해 본다.