이미지:본지
이미지:본지

 


GPT-3와 페이스북 AI의 블렌더봇 첫 번째 버전과 같은 인공지능(AI) 언어 생성 모델은 적어도 진행 중인 대화의 맥락에서 자신을 명확하게 표현하고 현실적으로 보이는 텍스트를 생성할 수 있다. 하지만, 그들은 매우 짧은 기억력과 정적인 정보로 이전에 학습된 것에 한정되어 있다.

즉, 그들은 이전에 학습한 것에 국한된다는 것으로 결코 추가적인 지식을 얻을 수 없다는 것이다. 예를 들어, GPT-3와 이전의 블렌더봇은 NFL 슈퍼스타 톰 브래디(Tom Brady)가 여전히 뉴잉글랜드 패트리어츠(New England Patriots)에 있다고 믿고 있으며, 그가 탬파베이 부케너스(Tampa Bay Buccaneers)와 함께 2021년 슈퍼볼에서 우승했다는 것을 알지 못한다.

게다가 그들은 과거의 인기 있는 TV쇼와 영화에 대해 알고 있지만, 미국의 슈퍼히어로 드라마 완다비전(WandaVision)과 같은 새로운 시리즈에 대해서는 전혀 알지 못한다.

다시 말해, 어제 GPT-3나 블렌더봇에 뭔가 얘기했다면 오늘 대화에서는 어제의 기억을 잊어버린다. 여기에, 더 안좋은 것은 알고리즘의 결함 때문에 모델들은 환각적인 지식(Infamously Hallucinate knowledge)으로 즉, 정확하지 않은 정보를 자신 있게 이야기한다.

이에 페이스북 AI 연구소(Facebook AI Research)는 지속적으로 접속할 수 있는 장기기억장치(Long-Memory)를 구축하고 현재까지의 어떤 모델보다 실시간 인터넷 검색과 거의 모든 주제에 대한 정교한 대화 등을 동시에 할 수 있는 성능이 뛰어나고 더 인간적인 느낌을 줄 수 있는 새로운 인공지능(AI) 챗봇 '블렌더봇 2.0 (BlenderBot 2.0)'모델과 데이터 세트를 16일(현지시간) 오픈소스로 공개했다.



GPT-3 대화 모델과 '블렌더봇 2.0의 대화 구사능력 비교(출처:페이스북)
GPT-3 대화 모델과 '블렌더봇 2.0의 대화 구사능력 비교(출처:페이스북)

 

 

이 솔루션은 인성, 공감, 지식과 같은 여러 대화 기술을 단일 시스템으로 결합한 최초의 AI 챗봇으로 사람들과 대화할 때, 지난해 5월 공개한 이전 모델인 ‘블렌더 1.0(BlenderBot 1.0)’ 보다 다양한 세션에서 더 길고, 더 박식하며, 사실적으로 일관된 대화를 구사한다.

특히, 이 모델은 대화중에 수집한 관련 정보는 장기기억에 저장하므로 며칠, 몇 주 또는 몇 달 동안 계속될 수 있는 지속적인 대화에서 이 지식을 활용할 수 있다. 또 지식은 대화하는 사람마다 별도로 저장된다. 단, 한 대화에서 학습된 정보는 다른 대화에서 사용되지 않는다.

또한 대화중에 이 모델은 상황별 인터넷 검색 쿼리를 생성하고 결과를 읽고 사람들의 질문과 의견에 응답할 때 그 정보를 통합할 수 있다. 이것은 그 모델이 끊임없이 변화하는 세계에서 학습하고 최신 상태를 유지한다는 것을 의미한다.

페이스북 AI는 전체 모델, 코드 및 평가 설정을 공개하고, 인터넷 검색으로 강화된 인간 대화와 이전 세션을 참조하는 사람들과의 다중 세션 채팅 등 두 가지 새로운 대화 데이터 세트 역시 공개해 전 세계 연구자 및 개발자들이 이 모델을 재현하고 대화 AI 연구를 진전시킬 수 있도록 했다.

새로운 AI 대화형 모델 '블렌더봇 2.0 (BlenderBot 2.0)'은 많은 작업에서 대화 모델을 공유하고 학습 및 평가하기 위한 페이스북의 오픈소스 통합 플랫폼인 팔에이아이(ParlAI-다운)를 기반으로 한다. 또한 기억에 접근하고 환각(Infamously)을 줄이는 능력으로 블렌더봇 2.0은 공감, 지식, 성격 등 다양한 대화 기술을 한 시스템에서 혼합한 최초의 AI 챗봇인 블렌더봇 1.0 버전(2020.5.2, 본지 기사 참조)을 기반으로 한다.  [기사 더보기]

 


[출처 : 인공지능신문(http://www.aitimes.kr)]

[기자 : 최창현 기자(aitimes@naver.com)]