AI '신경망 조정' 지옥에서 탈출하기, '오토머신러닝'

2020년이 시작된 지 몇 주밖에 되지 않았지만, 오토머신러닝(AutoML)이라는 자동화된 머신러닝 모델링이 주목받고 있다. 특히 '신경망 구조 탐색(Neural Architecture Search, NAS)'이라는 유망한 오토머신러닝 접근방식이 곧 데이터 과학자의 핵심 툴킷의 일부가 될 것으로 보인다. 이는 AI 머신러닝 모델의 핵심인 합성곱, 반복 및 기타 신경망 아키텍처를 최적화하는 자동화 툴과 방법론의 가능성을 의미한다.

<이미지를 클릭하시면 크게 보실 수 있습니다>

신경망 구조 탐색 툴은 데이터 기반 추론을 더 정확하고 신속하며 효율적으로 수행할 수 있도록 머신러닝 모델의 알고리즘 '뉴런'의 구조와 가중치, 하이퍼 파라미터를 최적화한다. 이 기술은 최근 AI 툴과 기술의 기본 연구 관련 실험에서 실제 적용되기 시작했다. 연구 문헌에 따르면, 많은 AI R&D 프로젝트에서 신경망 구조 탐색 툴이 이미 수동으로 설계된 신경망을 능가했음을 보여준다.

신경망 구조 탐색 상용화 임박 급성장하는 오토머신러닝 영역에서, 신경망 구조 탐색은 초기 상용화의 징후를 보인다. 예를 들면 이달 초 라스베이거스에서 열린 CES 2020에 몬트리올에 본사를 둔 AI 스타트업 딥라이트(Deeplite)가 참여했다. 이 업체의 라잇웨잇 인텔리전스(Lightweight Intelligence) 툴은 다양한 엣지 기기 플랫폼에서 고성능 추론을 위한 신경망을 자동으로 최적화한다. 채용하기 힘들고 임금도 높은 데이터 과학자의 수동 입력이나 안내도 필요 없다.

딥라이트의 툴이 어떻게 작동하는지 보려면 대만 기업인 안데스 테크놀로지(Andes Technology)와의 파트너십 논의를 확인하면 된다. 딥라이트의 하드웨어 인식 신경망 구조 탐색 엔진의 강화학습(Reinforcement Learning, RL) 엔진은 RISC-V 하드웨어에 탑재됐는데, 대형 신경망 모델을 자동으로 찾고 훈련한다. 그 결과 비주얼 웨이트 워드(Visual Wake Words)의 데이터 세트에 대해 학습된 모바일넷(MobileNet) 모델을 13MB에서 188KB 이하로 거의 99% 줄였지만, 신경망 추론 정확도는 단지 1% 하락에 그쳤다.

아마존, 오픈소스 오토머신러닝 툴킷 출시 신경망 구조 탐색 기술의 발전에 있어 또 다른 중요한 이정표는 아마존이 이 기능을 내장한 오픈소스 오토머신러닝 툴킷을 공개했다는 사실이다. CES와 같은 시기에 출시된 아마존의 오토글루온(AutoGluon) 툴을 이용하면 초보자부터 숙련자까지 다양한 AI 개발자가 새로운 또는 기존의 모델 최적화를 자동화해 다양한 하드웨어 플랫폼에서 고성능 추론 기능을 구현할 수 있다.

오토글루온은 머신러닝 모델의 데브옵스 흐름 내에서 데이터 준비, 모델 개발, 하이퍼 파라미터 튜닝, 훈련을 자동화한다. 기존 파이토치(PyTorch)와 MXNet 모델도 최적화할 수 있다. 또한 API를 통해 기존 AI 데브옵스 파이프라인과 인터페이스해 기존 머신러닝 모델을 자동으로 조정하고 이를 통해 추론 작업의 성능을 개선한다.

아마존은 현재 오토글루온을 리눅스 플랫폼에서 실행하고 있지만 맥OS와 윈도우에서도 지원할 계획이다. 이 프로젝트의 웹사이트 또는 깃허브에서 이용할 수 있는 오토글루온은 단 3줄의 파이썬(Python) 코드에서 고성능 머신러닝 모델을 자동으로 생성한다. 사용 가능한 컴퓨팅 리소스를 활용하고 강화학습 알고리즘을 사용해 대상 환경에 가장 적합한 신경망 아키텍처를 검색한다.

오토글루온은 강화학습(RL)을 통해 컴퓨팅 리소스를 효율적으로 사용해 자동 신경망 구조 탐색 속도를 높인다. 실제로 강화학습은 오토글루온과 딥라이트의 솔루션 모두에서 구현됐으며, 에이전트 중심의 작업과 보상을 사용해 보이지 않는 데이터에 대해 훈련된 아키텍처의 성능 평가를 기반으로 최적의 신경망 구조 공간을 탐색해 이 분야의 최근 발전에 가장 유익한 접근방식임이 입증되고 있다. 오토글루온의 자세한 작동방식은 오토글루온 웹사이트를 참고하면 된다.

강화학습은 1990년대부터 R&D 환경에서 신경망 구조 탐색의 중심이 된 진화 알고리즘에 대한 새로운 대안이다. 진화 알고리즘은 OpenAI, 우버랩(Uber Labs), 센션트 랩(Sentient Labs, 현 이볼브), 딥마인드(DeepMind), 구글 브레인(Google Brain) 등에서 여전히 널리 사용한다.

신경망 구조 탐색은 여전히 초기 단계 기업 부문에서 오토머신러닝 데이터 과학 플랫폼이 널리 보급됨에 따라, 앞으로 이와 같은 신경망 구조 탐색 툴이 표준 구성요소가 될 것으로 보인다. 그러나 이 기능은 대부분의 AI 데브옵스 환경에서는 여전히 거의 보기 힘들다.

올해 말까지 상용 및 오픈소스 AI 데브옵스 작업 중 절반 이상이 신경망 구조 탐색을 통합 기능으로 추가할 전망이다. 오토머신러닝이 도입되고 기능이 개선됨에 따라, 선형 회귀 및 랜덤 포레스트(Random Forest) 알고리즘과 같은 기존 머신러닝 알고리즘을 기반으로 모델을 구축할지, 아니면 최신의 진보된 신경망 알고리즘에 모델을 구축할지에 따라 데이터 과학자의 생산성이 결정될 수도 있다.

향후 10년간 신경망 구조 탐색 덕분에 데이터 과학자가 머신러닝 모델의 신경망을 상세히 알아야 할 필요가 줄어들 것이다. 이러한 새로운 접근방식은 개발자가 난해한 알고리즘을 조정하는 것에서 벗어나 예측 가능성이 높은 지능형 앱을 개발할 수 있도록 개발자의 기술을 높이는 효과를 낼 것이다. 이는 곧 AI의 진입 장벽을 낮추고 대중화하는 것이기도 하다. editor@itworld.co.kr

James Kobielus editor@itworld.co.kr