NVIDIA의 신규 AI '유레카'로 동작하는 로봇들을 만나보세요!

Find AI Tools in second

Find AI Tools

No difficulty

No complicated process

Find ai tools

Home AI News KR NVIDIA의 신규 AI '유레카'로 동작하는 로봇들을 만나보세요!

Updated on Feb 26,2024

NVIDIA의 신규 AI '유레카'로 동작하는 로봇들을 만나보세요!

💡 개요
💻 인공지능 시스템 유레카 소개
🤖 가상 로봇을 통한 복잡한 동작 학습
🧠 강화학습 모델과 보상 함수
🗜️ 보상함수 생성을 위한 인공지능 시스템 유레카
👨‍💻 인간 전문가의 감능보다 뛰어난 결과
✨ 유레카의 능력의 확장
💼 산업적 활용 및 사회적 영향
🌌 새로운 지평을 열다
🌐 유레카의 공개와 협업

💡 개요

Nvidia는 혁신적인 인공지능 학습 도구인 '유레카(Eureka)'를 공개했다. 이 시스템은 복잡한 동작과 과제를 로봇에게 자율적으로 지시할 수 있는 복합 인공지능 시스템이다. Nvidia는 유레카를 사용하여 10개의 가상 로봇에게 29가지 다양하고 복잡한 동작을 수행하는 방법을 가르쳤다. 유레카 시스템은 더 복잡한 인간 작업을 위한 기반이 되는 기초로서 인공지능이 가상으로 성능을 시뮬레이션하는 것이다. 이로써 인공지능 학습의 중요한 기반을 마련하게 되었다.

💻 인공지능 시스템 유레카 소개

유레카는 인공지능 학습 시스템으로서, 일련의 복잡한 동작을 수행하는 로봇에게 지시를 내릴 수 있는 능력을 갖춘다. 이러한 시스템은 '강화학습(reinforcement learning)'이라는 특정 형태의 신경망인 RL 모델에 기능을 제공한다. 이 RL 모델은 시뮬레이션 환경에서 반복적으로 동일한 작업을 수행하여 가장 효율적인 방법을 찾는 시행착오 접근법을 사용한다. 유레카 시스템은 학습 세션 동안 로봇이 올바른 응답을 보여줄 때 RL 모델에게 보상을 주는 '보상 함수(reward function)'라는 코딩 메커니즘을 사용한다. 이뿐만 아니라 실수에 대해서는 벌점을 부여하여 RL 모델을 점진적으로 로봇의 작업을 관리하는 최적의 방법을 찾도록 유도한다.

🤖 가상 로봇을 통한 복잡한 동작 학습

유레카는 가상로봇을 사용하여 복잡한 동작을 학습한다. 시뮬레이션 환경에서 인공지능이 자체적으로 훈련하여 펜 스핀 트릭과 같은 복잡한 동작을 마스터하는 과정을 입력 비디오에서 관찰할 수 있다. 이때 AI 학습 방식은 적절한 반응을 보여줄 때 로봇의 RL 모델에게 보상을 주는 보상 함수의 역할을 한다. 보상 함수는 유레카가 학습하는 도중 올바른 동작에 대해 로봇의 RL 모델에게 보상을 주는 역할을 수행하며, 이를 통해 로봇의 작업 관리를 점진적으로 향상시킨다.

🧠 강화학습 모델과 보상 함수

강화학습 모델은 여러 동작을 수행하는데 필요한 보상 함수를 생성하는 데 어려움을 겪는다. 하지만 Nvidia의 유레카 시스템은 이를 자동화하여 보상 함수를 생성한다. 유레카는 자연어 지시를 통해 로봇 팔에 체스를 가르치는 것과 같은 보상 함수를 생성할 수 있다. 또한 유레카는 사용자 프롬프트를 선별적인 보상 함수 형태로 변환하기 위해 OpenAI의 GPT-4를 활용한다. 이 시스템은 로봇 작업을 설명하는 지시사항을 포함하는 '환경 코드(environment code)'라는 일련의 명령을 받아들이고 처리한다. 유레카는 보상 함수의 다양한 변형을 생성하고 이를 시뮬레이션된 로봇 모델에 적용한 후 그 효과를 철저하게 평가하여 개선할 여지를 찾아낸다.

👨‍💻 인간 전문가의 감능보다 뛰어난 결과

Nvidia는 유레카가 사람 전문가가 만든 보상 함수보다 훨씬 우수한 결과를 보여준다고 밝혔다. 시험을 거친 로봇 작업 중 80% 이상에서 유레카가 사람 전문가가 만든 보상 함수보다 우수한 성능을 보였다. 이 프로젝트의 일환으로 개발된 10개의 가상 로봇의 성능은 놀라운 52%의 향상을 보였다. Nvidia의 AI 연구 분야에서 선임 연구원인 Anima Anandkumar는 강화학습은 지난 10년 동안 중요한 발전을 이루었지만 보상 설계의 도전이 여전히 시행착오 과정으로 진행되는데 유레카는 새로운 알고리즘 개발에 대한 선구자적인 단계라고 밝혔다. 유레카는 생성적 학습과 강화학습 방법을 조화롭게 통합하여 복잡한 작업을 해결하는 데 새로운 모델을 제공하는 것이다.

✨ 유레카의 능력의 확장

유레카는 유레카가 새롭게 생성하는 보상 함수를 지속적으로 개선하는 능력을 갖추고 있다. 시뮬레이션된 로봇 모델에 다양한 보상 함수를 적용한 후 결과를 철저하게 평가하여 성능을 개선한다. 이러한 과정에서 개발자의 의견을 수용하고 로봇의 보상 함수를 개선할 수 있다. 이러한 의견은 지속적인 코드 최적화 과정에 자연스럽게 통합된다. 이를 통해 Nvidia는 유레카가 테스트된 로봇 작업의 80% 이상에서 사람 전문가보다 뛰어난 보상 함수를 생성한다고 발표했다.

💼 산업적 활용 및 사회적 영향

Nvidia의 유레카는 산업에서 활용될 수 있는 큰 잠재력을 가지고 있다. 이러한 기술 발전은 사회에 큰 영향을 미치며 수조 단위로 확장될 수 있다. British Columbia 대학의 컴퓨터 과학 교수인 Jeff Clune은 AI 에이전트 개발에 있어 상당한 상업적 잠재력이 있다고 강조했으며 그 영향력은 수조 단위로 확대될 수 있다는 것을 강조했다. 이러한 발전은 사회적으로 엄청난 이점과 함께 깊은 영향을 가지기도 한다. Nvidia의 최신 연구는 이러한 발전의 이전 단계로서 Minecraft 게임 플레이에서 GPT-4 기능을 갖춘 Voyager AI 에이전트 개발을 포함한다. Voyager는 다른 AI 에이전트와 경쟁하면서 지속적으로 성과를 개선할 수 있는 능력을 갖추고 있다. 이는 AI 성능 향상을 위한 강력한 도구로 사용될 수 있다.

🌌 새로운 지평을 열다

Nvidia의 유레카는 신기술의 개발로서 이전의 연구를 더욱 발전시킨다. 이를 통해 현재 우리에게 익숙한 인공지능 시스템에 대한 새로운 지평을 열 수 있다. 기존의 대화형 AI 에이전트나 챗봇을 개선하는 연구들이 최근에 주목받고 있으며, Nvidia의 연구는 이러한 발전을 더욱 발전시키고 있다. 이를 통해 더욱 복잡한 작업을 수행할 수 있는 인공지능 시스템의 가능성이 확장된다.

🌐 유레카의 공개와 협업

Nvidia는 유레카의 핵심 요소를 공개하며 실험실 소프트웨어로 Github에서 운영되는 'Isaac Gym' 프로그램에서 엔지니어들이 이를 활용할 수 있는 기회를 제공한다. 이 프로그램은 AI 주도형 로봇 시스템의 개발을 위해 특별히 설계된 시뮬레이션 도구이다. 엔지니어들은 이 플랫폼을 활용하여 Nvidia의 유레카를 활용할 수 있다. 이를 통해 무거운 노동과 많은 시간이 필요한 기존의 보상 함수 작성을 자동화하고 최적화할 수 있다.