티스토리 뷰

생활 정보

데이터 라벨링 알바란

허니로즈 2021. 3. 9. 14:07

데이터 라벨링 알바를 하는 사람들이 많다고 하는데 무얼 의미하는지 잘 모르겠다. 궁금해서 뉴스의 내용을 요약해서 정리해보겠다. 데이터 라벨링이란, 데이터에 ‘라벨’을 씌워주는 작업이다. 데이터 노동이 ‘4차 산업혁명 시대의 인형 눈알 붙이기’라는 평가가 있다.

 

'데이터 라벨링'은 단순 업무가 많아 남녀노소 누구나 할 수 있고, 출퇴근을 하지 않고 자투리 시간을 활용할 수 있다는 점이 장점이다. AI 학습용 데이터 수집과 가공은 일이 어렵지 않으니 임금이 낮다. 숙련이 필요치 않으므로 자유계약직이나 임시직이 많다.

 

인공지능은 텍스트나 사진 등의 현실 데이터를 스스로 식별할 수 없어 사람이 ‘학습’을 시켜줘야 한다. 예를 들어, 자동차 이미지를 찾아 ‘자동차’ 라벨을 붙이면 인공지능이 이를 인식해 학습하고 알고리즘 고도화에 필요한 데이터를 축적하는 것이다.


 대부분의 데이터 라벨링 플랫폼이 ‘크라우드 소싱(Crowd Sourcing)' 형태로 인력을 구하는 이유가 바로 여기에 있다. 인공지능이 얼마나 데이터를 학습했는지가 곧 인공지능이 제공하는 서비스의 퀄리티와 직결되기 때문이다.


자율주행 자동차, 음성 인식, 텍스트 자동완성 등의 인공지능을 활용하는 기술이 많아짐에 따라 데이터 노동 수요 또한 급속도로 늘고 있다. 


  '데이터 라벨링'은 사진이나 동영상, 텍스트, 음성 등 다양한 종류의 데이터를 AI가 학습할 수 있는 형태로 가공하는 업무를 말한다. 얼굴 사진을 예로 들면 눈, 코, 입 등의 부위에 '라벨'을 달아 구분해주는 식이다.

 

 

정부가 '디지털 뉴딜' 정책을 발표한 후 데이터 관련 일자리가 늘어나고 있다. 민간 영역에서도 '데이터 라벨링'을 부업으로 찾는 사람들도 늘고 있다. 

 

데이터 산업은 4차 산업혁명 시대의 미래 핵심 인프라 산업으로 꼽히고 있다. 현재 축적된 빅데이터를 AI, 자율주행 등 미래산업에 활용할 수 있는 데이터로 재구축하기 위해서는 수집과 가공, 검수 등 직접 사람의 손을 거치는 작업이 진행되어야 한다. 이 과정 속에서 수많은 데이터 일자리들이 생겨날 것으로 예상되기 때문이다.

 

인공지능(AI)을 활용하기 위해서는 방대한 데이터가 필수다. AI는 딥러닝이나 머신러닝을 통해 학습을 하는 과정이 필요한데 이때 필요한 로(raw) 데이터를 입력하고 검수하는 등 학습자료를 만드는 과정이 데이터 라벨링이다.


하지만, 장시간 컴퓨터에 앉아서 데이터를 입력하다보면 눈이나 목, 허리 등에 무리가 될 수 있어 이에 대한 주의가 필요하다. 실제 데이터 라벨링 알바를 경험한 사람은 "데이터 라벨링 검수를 하는 알바는 단가는 좀 세지만 꼼꼼히 살펴야 해서 눈 건강을 주의해야 한다"며 "인공눈물을 챙겨야 한다"라고 말했다. 


'데이터 라벨링'의 분야는 다양하다.
가령 자율주행차 분야에서는 도로 주변 사물에 대한 데이터 처리 작업을 진행한다. 정지 이미지를 보고 차선이 점선인지 실선인지 구분하거나, 차량의 이동 패턴을 분류해야 한다. 언어 번역 분야에서는 지명이나 인물명 등 고유명사가 정확하게 표기됐는지 검수하는 작업 외에도 문장 번역의 완성도를 높이는 작업이 진행된다.

 

대략 알아보니 AI가 못하는 부분을 사람이 직접해야하는 세밀한, 소소한, 간단한 작업이라는 생각이 든다. 알바로 도전해봐도 좋을 듯하다.

반응형