강화 학습에 건 대형 베팅

이네퍼블 인텔리전스는 몇 달 전 전 딥마인드 연구원 데이비드 실버가 설립한 영국의 인공지능 연구소로, 인간 데이터 없이 학습하는 매우 다른 종류의 AI 모델을 추구하기 위해 11억 달러를, 기업가치 51억 달러에 모금했다.

회사는 시행착오를 통해 시스템이 인간이 생성한 예시를 공부하는 대신 스스로 개선하는 방법인 강화 학습을 통해 지식과 기술을 발견할 수 있는 '슈퍼러너'를 만들고 싶다고 말한다. 이 접근법은 실버의 경력과 밀접하게 연관돼 있다. 그는 Google 소유의 딥마인드에서 10년 넘게 강화 학습 연구를 이끌다가 새 벤처를 시작하기 위해 떠났다.

알파제로에서 더 넓은 포부로

실버가 딥마인드에서 수행한 연구는 체스와 바둑에서 인간의 게임 기록이나 전략을 학습하지 않고도 최고 수준의 인간 선수들을 이기는 시스템을 만들어냈다. 가장 잘 알려진 사례는 순수한 경험으로만 학습해 당시 세계에서 가장 강력한 컴퓨터 프로그램들을 무너뜨린 알파제로다.

이네퍼블 인텔리전스는 이제 그 아이디어를 보드게임을 훨씬 넘어 확장하려고 한다. 새로 개설된 웹사이트에 따르면, 회사는 슈퍼러너가 현재 대부분의 인공지능 시스템을 작동시키는 방대한 데이터셋에 의존하지 않고 스스로의 경험에서 "모든 지식"을 밝혀낼 수 있다고 믿는다.

연구소의 표현은 과감하다. 웹사이트는 이 노력이 성공하면 다윈과 비교할 만한 과학적 돌파구에 해당할 것이며, 그 법칙은 모든 지능을 설명하고 구축할 것이라고 덧붙였다.

실버는 유니버시티 칼리지 런던의 교수이기도 한데, 회사 블로그에 나중에 게재된 개인 글에서 이네퍼블 인텔리전스를 "평생의 작업"이라고 묘사했다. 그는 와이어드와의 인터뷰에서 회사로부터 벌게 될 모든 돈을 사회적 영향력이 큰 자선단체에 기부할 것이라고도 말했다.

지금으로서는 회사 재정이 이야기 중 가장 덜 미스터리한 부분으로 보인다. 11억 달러의 자금 조달은 투자자들이 오늘날 업계의 많은 부분을 규정하는 인간 데이터 파이프라인을 넘어 인공지능을 이동시키려는 장기 도전에 베팅할 의지가 있음을 보여준다.

출처:

테크크런치.com