“아이 재운 뒤 4시간 동안 집에서 일하고 120만원 법니다”
4년차 호텔리어 김 모 씨는 코로나19로 인해 3개월째 휴직 상태인데요. 반강제적으로 휴식기를 갖게 된 그가 얼마 전부터 하고 있는 소일거리는 바로 사진에서 도로를 골라 표시하는 일입니다. 김 씨가 작업한 작업물들은 AI를 학습시키는 자료로 활용되는데요. 전문지식을 필요로 하지 않을뿐더러 노동강도도 높지 않아 부업으로 하기에 제격이라고 합니다.
AI 산업이 발전함에 따라 자연스레 데이터를 수집하고 가공하는 부문에서 일의 수요가 급증하고 있는데요. 국내 노동시장에 새롭게 진출한 ‘데이터 노동’에 취업 준비생, 대학생, 전업주부, 휴직자 등 다양한 이들이 몰리고 있습니다. 일명 ‘디지털 눈알 붙이기’로 불리며 많은 이들에게 새롭게 각광받고 있는 부업 아이템의 정체에 대해 한 번 알아보겠습니다.
사진출처_조선일보 |
사진출처_유튜브 ‘사랑합니다 고객님’ 캡처 |
빅데이터를 기반으로 움직이는 AI 산업의 향후 가치에 대해 반대를 제기하는 이들은 그리 많지 않을 텐데요. AI가 알고리즘을 기반으로 사용자의 취향에 꼭 맞는 음식, 음악, 영화, 장소 등을 추천할 수 있는 이유는 단연 다량의 정보, 일명 ‘빅데이터’ 때문입니다. AI가 빅데이터를 인식하는 과정에서는 반드시 사람의 손길이 닿아야 하는데요. AI가 빅데이터를 인식할 수 있도록 자료를 일정한 양식으로 수정하는 작업을 ‘데이터 라벨링’이라고 하며 이 작업을 수행하는 이들은 ‘데이터 노동자’로 불립니다.
사진출처_KBS뉴스 |
사진출처_테스트웍스 |
예를 들어 AI가 ‘강아지가 물을 마시는 모습’을 추출한다고 가정하면 AI가 ‘강아지’를 판단하는 데만 수천, 수만 장의 강아지 사진이 필요한데요. ‘물을 마시는 행위’를 AI에게 학습시키는 것도 마찬가지로 많은 품이 듭니다. 이때 사람은 어떤 사진을 보더라도 ‘강아지’와 ‘물을 마시는 행위’를 직관적으로 바로 구분할 수 있기에 데이터 노동자가 구분한 자료를 AI가 인식 및 분석할 수 있도록 하면 AI의 업무 처리 속도와 정확도가 훨씬 높아지게 되는 결과를 낳을 수 있는 것이죠.
사진출처_영화 ’82년생 김지영’ |
사진출처_슈퍼브에이아이 |
중학교 교사 일을 그만두고 육아에 전념하고 있는 서모 씨는 지난달부터 지인의 추천으로 데이터 라벨링 일을 하고 있는데요. 그는 카메라 영상에 찍힌 차량, 도로, 실선 및 점선을 구분하는 일을 수행하고 있으며 서 씨가 작업한 자료들은 자율주행 AI 연구에 사용됩니다. 서 씨는 낮에는 집안 일과 육아에 전념하고, 아이들이 잠든 뒤 저녁 8시부터 일을 시작하는데요.
그녀는 “하루 최소 4시간은 컴퓨터 앞에 앉아있으려고 한다”라며 “정해진 출퇴근 시간이 있는 것도 아니고 업무 강도도 그리 높지 않아서 아이들이 클 때까지 계속하려 한다”라고 전했습니다. 급여는 작업을 많이 하면 할수록 많이 받는 구조인데요. 서 씨는 보통 2~3주에 120만 원 안팎을 받는다고 합니다.
사진출처_중앙일보 |
데이터 라벨링은 정부가 일자리 창출을 위해 공을 들이고 있는 분야이기도 한데요. 현 정부는 지난해 7월 발표한 ‘디지털 뉴딜’정책을 통해 공공 및 민간 네트워크를 통해 생성되는 데이터를 한데 모은 ‘데이터 댐’을 구축하겠다고 발표했습니다. 정부는 이를 위해 향후 2025년까지 2조 5천억 원을 투입할 예정인데요. 데이터 단순 모음으로는 다른 연구 및 산업에 활용이 불가하기에 이를 알맞게 정리하는 데이터 라벨링 인력이 필요한 것이죠.
사진출처_KBS뉴스 |
정부는 데이터 댐 구축 작업이 일자리 39만 개 창출 효과를 낼 것으로 추산하고 있는데요. 이 같은 시도는 해외에서도 찾아볼 수 있습니다. 핀란드의 경우 교도소 수감자의 육체 노역을 데이터 라벨링으로 전환하려는 시도가 있었고, 중국은 제조업 불황으로 일자리를 잃은 노동자를 데이터 라벨링 인력에 투입하기도 했죠.
데이터 라벨링 시장은 전 세계적으로 그 규모가 확산되고 있는데요. 한 시장조사업체의 경우 전 세계 데이터 라벨링 시장이 오는 2023년까지 1조 4천억에 이를 것이라는 조사 보고서를 내놓기도 했습니다. 이러한 흐름에 힘입어 데이터 라벨링을 하는데 필요한 툴 시장 규모 역시 재작년 4700억 원에서 연평균 26%씩 성장해 오는 2027년에는 약 3조 원 규모로 폭증할 것이라는 전망이 나오는데요.
사진출처_SBS ‘드라마의 제왕’ |
사진출처_연합뉴스 |
데이터 라벨링은 대부분 업무가 고도의 기술이 필요치 않은 단순노동에 해당돼 ‘디지털 인형 눈알 붙이기’라고 불리기도 하지만, 현직자에 의하면 세간의 인식처럼 마냥 단순한 것만은 아니라고 합니다. 박모 씨의 경우 건물의 색 변화를 체크하는 작업을 하고 있는데요. 박 씨는 “상공에서 찍은 건물 사진의 경우 날씨, 해가 드는 방향에 따라 각도와 채도가 조금씩 계속 달라져 업무를 시작할 초반에는 사내 매니저한테 계속 질문을 했었다”라고 전했습니다.
사진출처_대한민국정책브리핑 |
사진출처_뉴스1 |
자율주행 AI에 활용될 데이터 라벨링 업무를 하고 있는 서모 씨 역시 “실선인지 점선인지 구분해야 하는데 큰 차량에 도로가 상당 부분 가려져 있을 경우 판단이 쉽지 않다”라며 “혹시 잘못 판단해 쓸 수 없는 데이터를 회사에 제출할까 봐 작업할 때마다 긴장이 되는 것도 사실”이라고 밝혔습니다.
사진출처_유튜브’stream of sense의식의 흐름’ |
디지털 라벨링은 별도의 사무공간이 필요치 않을뿐더러 고도의 사전 지식이 필요 없어 요즘 같은 비대면 시대에 안성맞춤인 부업으로 인기를 끄는데요. 하지만, 마냥 좋은 평가만 듣고 있는 것은 아닙니다. 우선 저임금 체계가 디지털 라벨링의 일자리로서의 태생적 한계로 꼽히는데요.
한국노동사회연구소가 올해 3월 발표한 ‘온라인 마이크로 워크 노동 상황’보고서에 의하면 데이터 레이블링 노동자들은 매일 평균 2.7시간을 일하고 한 달에 36만 7천 원의 수입을 올리는 것으로 나타났습니다. 디지털 라벨링 업무로만 한 달 생계를 유지하기엔 턱없이 부족한 금액이죠.
사진출처_지니넷코리아/내손안에 서울 |
이외 향후 기술이 더 발달되면 데이터 라벨링 업무 자체를 위한 AI가 개발돼 데이터 노동자들의 일자리를 잃게 할 수도 있다는 우려도 제기되는데요. 업계 관계자는 “지금도 데이터 라벨링 업무의 상당 영역이 자동화툴에 기대고 있는데 이후 점차 이 기술이 발달하면 데이터 노동자들의 업무를 완전히 대체할 수도 있을 것”이라고 전했습니다.
지금까지 21세기형 부업으로 관심을 받고 있는 데이터 라벨링 업무에 대해 알아봤는데요. 정부가 AI 산업의 고부가가치성을 인정하고 아낌없는 지원을 약속한 만큼 향후 몇 년간은 데이터 라벨링 관련 일자리가 폭발적으로 늘어나리라고 기대해 봐도 좋을 것 같습니다.