뉴스/정보
π0.5 : 오픈 월드 일반화를 갖춘 VLA
작성자
하이룽룽
작성일
2025-05-05 22:41
조회
22
https://www.physicalintelligence.company/blog/pi05
우리는 시각-언어-행동(VLA) 모델 π 0 을 기반으로, 이러한 지저분한 환경에 일반화할 수 있는 로봇 기반 모델을 개발해 왔습니다. π 0 와 다른 최근 VLA는 모두 훈련과 밀접하게 일치하는 환경에서 평가되지만, 우리는 완전히 새로운 환경에 의미 있는 일반화를 보이는 π 0.5 라고 부르는 새로운 모델을 개발했습니다 . 우리는 이것이 진정으로 일반화 가능한 물리적 지능을 향한 중요한 진전을 나타낸다고 믿습니다. 우리의 현재 모델은 완벽과는 거리가 멉니다. 목표는 새로운 기술을 습득하거나 높은 손재주를 보여주는 것이 아니라 훈련 데이터에서 볼 수 없었던 새 집에서 주방이나 침실을 청소하는 것과 같은 새로운 설정으로 일반화하는 것입니다. 우리의 실험에서 π 0.5는 완전히 새로운 집에서 다양한 작업을 수행할 수 있습니다. 항상 첫 번째 시도에서 성공하는 것은 아니지만, 사람이 새로운 도전에 접근할 때의 유연성과 수완을 암시하는 경우가 많습니다.
우리는 시각-언어-행동(VLA) 모델 π 0 을 기반으로, 이러한 지저분한 환경에 일반화할 수 있는 로봇 기반 모델을 개발해 왔습니다. π 0 와 다른 최근 VLA는 모두 훈련과 밀접하게 일치하는 환경에서 평가되지만, 우리는 완전히 새로운 환경에 의미 있는 일반화를 보이는 π 0.5 라고 부르는 새로운 모델을 개발했습니다 . 우리는 이것이 진정으로 일반화 가능한 물리적 지능을 향한 중요한 진전을 나타낸다고 믿습니다. 우리의 현재 모델은 완벽과는 거리가 멉니다. 목표는 새로운 기술을 습득하거나 높은 손재주를 보여주는 것이 아니라 훈련 데이터에서 볼 수 없었던 새 집에서 주방이나 침실을 청소하는 것과 같은 새로운 설정으로 일반화하는 것입니다. 우리의 실험에서 π 0.5는 완전히 새로운 집에서 다양한 작업을 수행할 수 있습니다. 항상 첫 번째 시도에서 성공하는 것은 아니지만, 사람이 새로운 도전에 접근할 때의 유연성과 수완을 암시하는 경우가 많습니다.
전체 0