몇 가지 시각적 데모로 모델을 학습하고 인간의 행동을 관찰한 다음 추론하도록 로봇을 훈련시켰다. 이 방법은 물리적 로봇에서 시각적 데모를 사용하여 '역강화학습(Inverse Reinforcement Learning)'을 사용...

 

 

사람들은 단순하고 일상적인 일을 배우는 데 매우 효율적이다. 예를 들어, 사람이 몇 번 과제를 보여주는 것을 보는 것만으로도 테이블 위에 병을 집어 올리거나 놓는 법을 배울 수 있다.

 

로봇 역시 인간만을 관찰함으로써 새로운 과제를 배울 수 있는 자동화된 로봇이 아주 가까운 미래에 집에서, 가정용 로봇에게 일상적인 집안일을 하는 방법을 가르치고 직장에서는 신입사원처럼 로봇을 훈련시켜 여러 가지 임무를 수행하는 방법을 보여줄 수 있는 것으로 예상된다.

 

예를 들어, 티칭(학습) 없이 로봇에게 집안일을 하는 방법을 보여주는 것으로 로봇은 인간의 행동을 관찰함으로써 식탁을 차리는 것과 같은 복잡한 일을 수행하는 법을 배운다.

 

MIT 연구팀은 지난해 3월 AI 강화학습으로 이러한 유형의 로봇들이 복잡한 작업을 학습할 수 있도록 하는 '불확실한 스펙을 가진 계획 수립(Planning with Uncertain Specifications. PUNS)' 시스템을 개발했다. 연구팀의 로봇은 그러한 과제 중 하나로 특정한 조건 하에서 저녁 식탁을 차리는 것이다.(본지 보도 2020.03.08. 보기)

 

여기에, 페이스북 AI 연구팀이 가세했다 로봇에게 이러한 방식으로 학습할 수 있도록 가르치는 새로운 기술(몇 가지 시각적 데모)로 환경의 모델을 학습하고 인간의 행동을 관찰한 다음 추론하도록 로봇을 훈련시켰다. 이 방법은 물리적 로봇에서 시각적 데모를 사용하여 모델 기반 '역강화학습(Inverse Reinforcement Learning. 이하, IRL)'을 사용한 첫 번째 솔루션으로 오픈 소스로 지난 25일 공개했다. [기사 더보기]

 

 

[출처 : 인공지능신문(http://www.aitimes.kr/)]

[기자 : 최창현 기자(aitimes@naver.com)]