IT 정보

데이터 라벨링 작업이 인공지능 AI에서 필요한 이유

FOCUSKR 2022. 8. 6. 21:55
반응형

 

인공지능(Artificial Intelligence)이란 인간의 사고력과 판단력, 지각 능력 등 사람이 판단하고 이해할 수 있는 부분을 컴퓨터가 대신할 수 있는 컴퓨터 과학의 일종이지만 결국에는 컴퓨터이기 때문에 사람의 무한한 지능을 완벽하게 따라 하기에는 매우 어려운 일이고 설령 가능하다 하더라도 제3의 선택인 어떤 것이 더 타당한가에 대한 선택이 부족할 수 있다.

 


무작정 만든다고 되는 게 아니다?

 

인공지능은 무작정 만든다고 해서 구현이 되고 지능을 갖게 되는 것이 아닙니다. 반드시 인공지능이 무엇을 하기 위해 만들어지는 것인가, 어떤 행동을 할 것인가 등 구체적인 목적성을 가지고 만들어지는데 예를 들면 알파고의 경우 고성능 인공지능이지만 오로지 가능한 것은 바둑입니다.

 

따라서 인공지능은 하나의 목적을 가지고 거기에만 인간보다 더 높은 효율성과 낮은 오류를 가지고 동작하는 것으로 사실상 사람처럼 다양한 행동을 동시에 생각하기라고는 현재로서도 불가능에 가까운 상태이고 앞으로도 보려면 엄청난 시간을 가져야 할 것입니다.

 


인공지능이 필요한 데이터

 

사람은 태어날 때부터 모든 지식을 가지고 태어나는 것이 아니며 사람마다 특출 나게 할 수 있는 잠재적 능력도 사람마다 다 다르며 컴퓨터도 마찬가지입니다. 단순한 컴퓨터는 모든 지식을 가지고 태어나는 것이 아닌 오로지 명령으로만 동작하는 큰 계산기에 불과한데 인공지능에서는 어느 정도 달라질 수 있습니다.

 

하지만 인공지능이라고 해서 똑같이 지식을 가지고 태어나는 것이 아닌 인공지능이 지식을 가질 수 있도록 데이터를 주고 이 데이터를 스스로 학습하면서 정의를 내리고 이것이 이것이다.라는 기본 배경지식을 학습하게 되면 하나의 인공지능이 탄생할 수 있는 것인데 사람이 학습하는 방식과 동일합니다.


데이터 라벨링이 그 행동 중 하나

 

데이터 라벨링이란 문서나 이미지, 동영상 등 다양한 데이터 자료에서 인공지능이 학습해야 하는 것이 무엇인지 표시를 하고 표시한 내용을 베이스로 인공지능이 이해하도록 유도하는 행위 중 하나로 인공지능 학습 과정에서 매우 중요한 과정이라고 볼 수 있습니다.

 

다르게 말해 인공지능이 학습해야 하는 데이터에 대해서 미리 정의를 내려주고 이게 자동차다, 강아지다 등 무엇인지를 인공지능이 이해시키기 위한 배경지식 데이터이며 데이터 라벨링은 필요할 수도, 없을 수도 있는 작업 중 하나입니다. 만약에 이미지에 차만 보인다면 당연히 할 필요가 없겠죠?


마치며

 

데이터 라벨링으로 만들어진 데이터로 인공지능이 학습을 하게 되지만 당연히 사람도 오류가 있듯이 인공지능도 오류를 가지고 있을 수 있지만 인공지능은 스스로 오류가 있는지 알기 어려우며 잘못된 판단을 하는 경우가 다소 존재하다 보니 XAI(eXplainable Artificial Intelligence)라고 하는 스스로 왜 그렇게 판단하였는가에 대한 설명이 가능한 인공지능도 개발되고 있습니다.

 

이런 인공지능은 스스로 판단한 결과를 알려주고 왜 그렇게 이해하였는가를 알 수 있게 되니 인공지능을 운영하는 경우에는 왜 이런 오류가 발생하였는지 쉽게 알 수 있게 될지도 모릅니다. 하지만 스스로 판단할 수 있을 뿐이지 스스로 데이터를 만들어내는 것은 매우 어렵고 결국에는 위와 같은 과정들을 거쳐야만 스스로 판단할 수 있는 여건이 만들어진다는 것입니다.

 

 

 

글이 유익하셨다면 공감, 댓글, 구독해주시면 블로그 발전에 큰 도움이 됩니다. ^^-

반응형