본문 바로가기

IT 정보

사이트 이용할 때 괴롭히는 구글 reCAPTCHA가 존재하는 이유

반응형

 

해외 사이트나 몇몇 사이트를 이용하다 보면 꼭 보게 된다는 '당신은 사람입니까?'에 대해 물어보는 사람과 컴퓨터를 구별하기 위해 만들어진 시스템으로 CAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart)로 흔히 튜링 테스트로 유명한 것이 이 CAPTCHA라고 불리는 것인데 때로는 귀찮게 하거나 때로는 편할 때도 있고 어쩔 때는 아예 표시가 되지 않는 경우도 있습니다.

 


◆ CAPTCHA가 생긴 이유

 

 

CAPTCHA는 자동화 프로그램이나 인공지능을 사용하여 불법 스팸이나 가입, 글쓰기 등 자동으로 하는 행위를 원천적으로 막으면서 동시에 한 번에 많은 작업을 하는 것을 방지하고자 튜링 테스트를 활용하여 글자나 이미지를 보고 유동적으로 판단할 수 있는 사람만 구별이 가능한 내용을 보여주게 되면서 컴퓨터인지 사람인지 판단하는 시스템으로 발전해온 것입니다.

 


◆ reCAPTCHA

 

 

가장 유명한 CAPTCHA라고 하면 구글이 만든 reCAPTCHA가 있는데 어쩔 때는 그냥 체크만 하면 되기도 하고 때로는 이미지처럼 자동차, 비행기, 보트 등 다양한 물체에 대해서 선택하는 것으로 바뀌기도 하는데 그 이유는 reCAPTCHA는 점수 제도를 도입했기 때문입니다.

 

reCAPTCHA의 점수는 사용자가 어떤 행위를 하고 있는지, 어떤 페이지를 보고 있는지, 반복적인 행위를 하고 있지 않은지 등 다양한 항목을 점수화하여 계산하고 최종적으로 점수를 결정짓게 되는데 일정 점수까지 내려가게 된다면 위와 같은 식별 문제가 나타나게 되는 것인데 문제를 풀 경우 일정 점수를 획득하여 다음 CAPTCHA 검증 시 간단하게 검사를 한다던지 혜택을 주기도 합니다.

 

 

반대로 문제를 풀지 못하거나 반복적으로 쉬운 문제만 풀기 위해서 새로고침만 계속 누르게 된다면 가면 갈수록 어려운 문제가 나타나게 되는데 그렇게 될 경우 사람이어도 풀기 까다로운 문제들이 나오면서 reCAPTCHA가 설치되어 있는 모든 사이트에서 귀찮아지게 됩니다...

 


◆ 식별 문제의 의미

 

 

reCAPTCHA에 보면 자동차, 보트, 비행기, 소화전, 신호등 등 다양한 사물에 대해서 선택하라는 문제가 나오는데 대부분 이미지를 보면 누가 봐도 현실에 있는 이미지인 것을 알 수 있는 부분이어서 왜 하필이면 이런 것들이지? 하면서 가끔 궁금하기도 합니다.

 

결론부터 말씀드리면 구글이 진행하고 있는 자율주행 차량과 구글 어스와 지도의 정확도와 사물 구별을 위해서 인공지능 능력 향상에 필요한 데이터를 만드는 이미지 라벨링 [각주:1] 작업을 reCAPTCHA에 적용하여 인공지능을 학습시키고 있는 것입니다.

 

따라서 구글의 자율주행 차량의 인공지능 학습능력 향상을 위해서 우리도 모르게 공부시켜주고 있던 것입니다.


글이 유익하셨다면 공감, 댓글, 구독해주시면 블로그 발전에 큰 도움이 됩니다. ^^-

 

 

 

 

 

  1. 인공지능을 학습시킬 때 사용하는 데이터를 사전에 어떤 사물인지를 알려주는 작업 [본문으로]
반응형