가정용 로봇이 실용성을 가지려면 취급할 예정인 물체를 인식할 수 있어야 한다. 그러나 비록 물체 인식이 인공 지능 분야에 가장 널리 연구되고 있는 주제 가운데 하나이지만, 심지어 가장 좋은 물체 인식기도 아직 많은 경우에 실패한다. 미국 매사추세츠 공대(MIT)가 개발한 새로운 알고리즘은 가정용 로봇이 어수선한 환경 속에서 물체를 더 잘 인식하게 만들 가능성이 있다.
가정용 로봇이 자신의 정체성에 대한 판단을 수행하기 전에 자신의 이동성과 상대적으로 정적인 환경을 이용할 수 있어야 한다고 미국 매사추세츠 공대(MIT) 컴퓨터 과학 및 인공 지능 연구소(Computer Science and Artificial Intelligence Laboratory)의 연구원들은 믿고 있다. 그러나 다른 이미지들 속에 묘사된 물체들을 일치시키는 것은 연산측면에서 도전과제를 제시하고 있다.
로봇 연구와 연관된 한 국제 학술지(학술지명: International Journal of Robotics Research)에서 매사추세츠 공대(MIT) 연구자들 서로 다른 관점을 모으는 기존의 규격화된 알고리즘을 이용하는 시스템이 오인식의 수를 줄이면서 단일 관점을 이용하는 것보다 4배나 더 많은 물체를 인식할 수 있다는 것을 보였다.
그리고 연구자들은 새로운 알고리즘이 정확할 뿐만 아니라 어떤 경우에 10배 더 빨라서 가정용 로봇이 실시간으로 배치되는 것을 훨씬 더 실용적으로 만들고 있음을 보였다.
"만약 당신이 단지 하나의 관점으로 관찰한 결과만을 본다면, 생략되는 물건들이 많을 수 있으며, 조명의 방향이나 물체를 가리고 있는 것들이 탐지기에 시스템적인 오류를 야기할 수 있다. 이를 피하는 한 가지 방법은 단지 이동하여 다른 관점으로 가는 것"이라고 발표된 논문의 주 저자이며 매사추세츠 공대 전기 공학 및 컴퓨터 과학과의 대학원생인 로슨 웡(Lawson Wong)이 말했다.
로슨 웡과 그의 논문 지도교수인 컴퓨터 과학 및 공학 전공의 레슬리 카엘블링(Leslie Kaelbling), 공학부 교수인 토마스 로자노 페레즈(Tomas Lozano-Perez)는 테이블 위에 놓인 다수의 가정용 물품에 대한 20~30개의 서로 다른 이미지를 가지는 시나리오를 고려하였다. 이 시나리오에서 같은 물품이 여러 번 나오고, 서로 가깝게 함께 포장된 것이 포함되었으며, 이 모두가 다른 관점에서 물체를 일치시키는 작업을 더 어렵게 만들었다.
연구자들이 시도한 첫 번째 알고리즘은 레이더와 같은 추적 시스템을 위하여 개발되었다. 이러한 추적 시스템은 서로 다른 시간에 촬영된 물체가 사실 같은 것인지를 결정해야 한다. "이 기술은 수십 년이 된 것이다. 그리고 실제로 잘 작동하며, 대부분의 사람들이 생각하게 되는 첫 번째의 알고리즘"이라고 로슨 웡이 말했다.
알고리즘은 연속적인 이미지들의 각각의 쌍에 대하여 하나의 이미지에 있는 물체가 다른 이미지에 있는 물체들과 일치한다는 여러 가지 가정을 만든다. 문제는 새로운 관점이 더해짐에 따라 증가되는 가정의 수가 문제를 복잡하게 만든다. 이러한 계산을 감당할 수 있도록 만들기 위하여 알고리즘은 각각의 단계에서 상위 가정들을 제외하고 모든 가정들을 폐기하였다. 비록 이러한 작업을 수행하더라도 최종 가정이 생성된 후에 남겨진 상위 가정들 모두를 분류하는 데에 많은 시간이 소모되었다.
좀 더 효율적인 알고리즘을 만들기 위하여 매사추세츠 공대 연구자들은 다른 접근법을 채택하였다. 알고리즘은 연속적인 이미지들 간에 생성된 가정들 가운데 어느 것도 폐기하려고 하지 않았고, 이 모두를 조사하려고 시도하지도 않았다. 대신에 가정들 가운데 임의로 표본을 추출하였다. 서로 다른 가정들 사이에 상당한 중첩이 발생하기 때문에 적당한 수의 표본은 임의의 연속된 2개 이미지에서 물체들 사이의 일치점에 대한 의견 일치가 일반적으로 이루어졌다.
연구자들은 요구되는 표본의 수를 낮게 유지하기 위하여 가정을 평가하는 단순화된 기법을 채택하였다. 예를 들어 알고리즘이 하나의 제1관점에서 3개의 물체, 또 다른 제2관점에서 4개의 물체를 식별한다고 가정하자. 이러한 가정을 비교하는 수학적으로 가장 정확한 방법은 2개의 물체 집단 사이에 가능한 모든 정합을 고려하는 것이 될 것이다. 예를 들어 제1관점의 물체 1, 2, 3을 제2관점의 물체 1, 2, 3 또는 제2관점의 물체 1, 2, 4 또는 제2관점의 물체 1, 3, 4 등과 같이 짝을 이루도록 하는 것이다. 만약 당신이 탐지기가 오류를 만들어 일부 물체가 다른 관점에서 중첩되었다는 가능성을 포함하는 경우 이러한 접근법은 304개의 서로 다른 정합 집합을 만들게 될 것이다.
대신에 연구자들이 제안한 알고리즘은 제1집단에서 각각의 물체를 개별적으로 고려하고, 이를 제2집단에 있는 물체들로 짝짓게 될 가능성을 평가한다. 그래서 제1집단의 물체 1은 제2집단의 물체 1, 2, 3, 4 가운데 하나로 짝지을 수 있으며, 제1집단의 물체 2와 물체 3도 마찬가지이다. 여기서 탐지기의 오류 및 중첩의 가능성이 포함된다면 이러한 접근법은 단지 20개의 비교만을 필요로 한다.
그러나 이 접근법은 터무니없는 결과를 만들 수 있다. 알고리즘은 제2그룹의 물체 3이 제1그룹의 물체 3과 정합되고, 동시에 제2그룹의 물체 4도 제1그룹의 물체 3과 정합된다고 결론을 낼 수도 있다. 그래서 연구자들은 알고리즘이 이러한 중복된 정합을 찾아 재평가하도록 만들었다. 비록 이러한 작업이 추가적인 시간을 필요로 하지만, 모든 가능성을 평가하는 것보다 적게 소요된다. 이 경우 알고리즘은 20개보다 많은 32개의 비교를 수행하게 될 것이며, 304개보다는 훨씬 적은 것이다.
출처 KISTI 미리안 『글로벌동향브리핑』