언어, 로봇 파괴, MIT 등은 GPT-4를 사용하여 시뮬레이션 작업을 생성하고 이를 현실 세계로 마이그레이션합니다.
콘텐츠를 다음과 같이 다시 작성했습니다: Machine Heart Report
편집자: Du Wei, Xiaozhou
GPT-4와 로봇이 새로운 불꽃을 일으켰습니다.
로봇 분야에서 보편적인 로봇 전략을 구현하려면 많은 양의 데이터가 필요하며, 현실 세계에서 이 데이터를 수집하는 것은 시간이 많이 걸리고 힘든 일입니다. 시뮬레이션은 장면 및 인스턴스 수준에서 다양한 양의 데이터를 생성하기 위한 경제적인 솔루션을 제공하지만, 시뮬레이션 환경에서 작업 다양성을 늘리는 것은 필요한 인력이 많이 필요하기 때문에(특히 복잡한 작업의 경우) 여전히 어려움에 직면해 있습니다. 이로 인해 일반적으로 수십에서 수백 개의 작업만 포함하는 일반적인 인공 시뮬레이션 벤치마크가 생성됩니다.
어떻게 해결하나요? 최근 몇 년 동안 대규모 언어 모델은 다양한 작업을 위한 자연어 처리 및 코드 생성 분야에서 계속해서 상당한 진전을 이루었습니다. 마찬가지로 LLM은 사용자 인터페이스, 작업 및 동작 계획, 로봇 로그 요약, 비용 및 보상 설계를 포함하여 로봇공학의 여러 측면에 적용되어 물리 기반 및 코드 생성 작업 모두에서 강력한 기능을 보여줍니다.
최근 연구에서 MIT CSAIL, Shanghai Jiao Tong University 및 기타 기관의 연구원들은 LLM을 사용하여 다양한 시뮬레이션 작업을 생성하고 그 기능을 더 탐구할 수 있는지 추가로 조사했습니다.
구체적으로 연구원들은 작업 자산 배열 및 작업 진행을 설계하고 확인하기 위한 자동화된 메커니즘을 제공하는 LLM인 GenSim을 기반으로 하는 프레임워크를 제안했습니다. 더 중요한 것은 생성된 작업이 매우 다양하여 로봇 전략의 작업 수준 일반화를 촉진한다는 것입니다. 또한 개념적으로 GenSim을 사용하면 LLM의 추론 및 인코딩 기능이 시뮬레이션 데이터의 중간 합성을 통해 언어-시각-행동 전략으로 정제됩니다.
다시 작성해야 할 내용은 다음과 같습니다. 논문 링크:
https://arxiv.org/pdf/2310.01361.pdf
GenSim 프레임워크는 다음 세 부분으로 구성됩니다.
- 첫 번째는 자연어 명령과 해당 코드에 의해 구현된 프롬프트 메커니즘을 통해 새로운 작업을 제안하는 것입니다.
- 두 번째는 검증 및 언어 모델 미세 조정을 위해 이전에 생성된 고품질 명령 코드를 캐시하고 이를 포괄적인 작업 데이터 세트로 반환하는 작업 라이브러리입니다. 마지막으로, 언어적응 다중업무 정책 훈련 프로세스는 생성된 데이터를 활용하여 업무 수준의 일반화 능력을 향상시킵니다.
아래 그림 1에서 연구원은 수동으로 선별된 10개의 작업이 포함된 작업 라이브러리를 초기화하고 GenSim을 사용하여 이를 확장하고 100개 이상의 작업을 생성했습니다.
그뿐만 아니라 연구원들은 다중 작업 로봇 전략도 훈련했는데, 이는 모든 생성 작업에 대해 잘 일반화되었으며 인간 계획 작업에만 훈련된 모델에 비해 제로 샷 일반화 성능이 향상되었습니다. GPT-4 세대 작업과의 공동 훈련은 일반화 성능을 50% 향상시키고 제로샷 작업의 약 40%를 시뮬레이션의 새로운 작업으로 전환합니다.
마지막으로 연구원들은 시뮬레이션에서 실제로의 전환도 고려하여 다양한 시뮬레이션 작업에 대한 사전 훈련이 실제 일반화 능력을 25% 향상시킬 수 있음을 보여주었습니다.
요약하자면, 다양한 LLM 생성 작업에 대해 교육된 정책은 새로운 작업에 대한 작업 수준 일반화를 향상시켜 LLM을 통해 시뮬레이션된 작업을 확장하여 기본 정책을 교육할 수 있는 가능성을 강조합니다.
Tenstorrent AI의 제품 관리 이사인 Shubham Saboo는 이 연구를 로봇과 결합한 GPT-4에 대한 획기적인 연구라고 말했습니다. 자동 조종 장치에서 일련의 시뮬레이션된 로봇 작업이 GPT-4와 같은 LLM을 통해 생성됩니다. 4. 제로샷 학습과 로봇의 실제 적응을 현실화합니다.
방법 소개
아래 그림 2와 같이 GenSim 프레임워크는 프로그램 합성을 통해 시뮬레이션 환경, 작업 및 데모를 생성합니다. GenSim 파이프라인은 작업 생성자에서 시작되며 프롬프트 체인은 대상 작업에 따라 목표 지향 모드와 탐색 모드의 두 가지 모드로 실행됩니다. GenSim의 작업 라이브러리는 이전에 생성된 고품질 작업을 저장하는 데 사용되는 인메모리 구성 요소입니다. 작업 라이브러리에 저장된 작업은 다중 작업 정책 교육 또는 LLM 미세 조정에 사용될 수 있습니다.
작업 생성기
아래 그림 3과 같이 언어 체인은 먼저 작업 설명을 생성한 다음 관련 구현을 생성합니다. 작업 설명에는 작업 이름, 리소스 및 작업 요약이 포함됩니다. 이 연구에서는 파이프라인에서 몇 가지 샘플 프롬프트를 사용하여 코드를 생성합니다.
작업 라이브러리
GenSim 프레임워크의 작업 라이브러리는 더 나은 새 작업을 생성하고 다중 작업 전략을 훈련하기 위해 작업 생성자가 생성한 작업을 저장합니다. 작업 라이브러리는 수동으로 생성된 벤치마크의 작업을 기반으로 초기화됩니다.
작업 라이브러리는 설명 생성 단계의 조건으로 작업 생성자에게 이전 작업 설명을 제공하고, 코드 생성 단계를 위한 이전 코드를 제공하며, 작업 생성자에게 작업 라이브러리에서 참조 작업을 샘플로 선택하도록 요청합니다. 새로운 작업을 작성합니다. 작업 구현이 완료되고 모든 테스트가 통과된 후 LLM은 새 작업 및 작업 라이브러리를 "반영"하고 새로 생성된 작업을 라이브러리에 추가해야 하는지 여부에 대한 포괄적인 결정을 내리라는 메시지를 받습니다.
아래 그림 4에서 볼 수 있듯이 연구에서는 GenSim이 흥미로운 작업 수준 조합 및 추정 동작을 보이는 것으로 관찰되었습니다.
LLM 감독형 다중 작업 전략
작업을 생성한 후 이 연구에서는 Shridhar et al.(2022)과 유사한 이중 스트림 전송 네트워크 아키텍처를 사용하여 이러한 작업 구현을 사용하여 데모 데이터를 생성하고 운영 정책을 교육합니다.
아래 그림 5에서 볼 수 있듯이 본 연구에서는 프로그램을 작업 및 관련 데모 데이터의 효과적인 표현으로 간주합니다(그림 5). 작업 간의 임베딩 공간 정의가 가능하며 거리 지수는 작업과 관련된 다양한 요소에 민감합니다. 인식(예: 물체의 자세 및 모양)이 더욱 강력해졌습니다.
내용을 다시 작성하려면 원문의 언어를 중국어로 다시 작성해야 하며, 원문이 나올 필요는 없습니다
이 연구는 실험을 통해 GenSim 프레임워크를 검증하고 다음과 같은 구체적인 질문을 다룹니다. (1) 시뮬레이션 작업을 설계하고 구현하는 데 LLM이 얼마나 효과적인가요? GenSim이 작업 생성에서 LLM의 성능을 향상시킬 수 있습니까? (2) LLM에서 생성된 업무에 대한 교육이 정책 일반화 능력을 향상시킬 수 있습니까? 더 많은 생성 작업이 주어지면 정책 교육에 더 많은 이점이 있습니까? (3) LLM 생성 시뮬레이션 작업에 대한 사전 교육이 실제 로봇 정책 배포에 도움이 됩니까?
LLM 로봇 시뮬레이션 작업의 일반화 능력을 평가합니다
아래 그림 6과 같이 탐색 모드와 목표 지향 모드 작업 생성의 경우 소수의 샘플과 작업 라이브러리로 구성된 2단계 프롬프트 체인이 코드 생성 성공률을 효과적으로 향상시킬 수 있습니다.
작업 수준 일반화
관련 업무에 대한 퓨샷 전략 최적화. 아래 그림 7의 왼쪽에서 볼 수 있듯이 LLM에서 생성된 작업을 공동으로 교육하면 특히 데이터가 적은 상황(예: 데모 5개)에서 원래 CLIPort 작업에 대한 정책 성능을 50% 이상 향상할 수 있습니다.
보이지 않는 작업에 대한 제로샷 정책 일반화. 그림 7에서 볼 수 있듯이 LLM에서 생성된 더 많은 작업에 대한 사전 학습을 통해 모델은 원래 Ravens 벤치마크의 작업에 더 잘 일반화할 수 있습니다. 그림 7의 오른쪽 중간에서 연구원들은 수동으로 작성된 작업, 폐쇄 소스 LLM 및 오픈 소스 미세 조정 LLM을 포함하여 다양한 작업 소스에 대한 5가지 작업에 대해 사전 교육을 받았고 유사한 제로샷 작업 수준을 관찰했습니다. 일반화.
사전 훈련된 모델을 현실 세계에 적용
연구원들은 시뮬레이션 환경에서 훈련된 전략을 실제 환경으로 옮겼습니다. 결과는 아래 표 1에 나와 있습니다. GPT-4 생성 작업 70개에 대해 사전 훈련된 모델은 9개 작업에 대해 10번의 실험을 수행했으며 평균 68.8%의 성공률을 달성했습니다. 이는 CLIPort 작업만 사전 훈련한 것보다 좋습니다. 기본 모델과 비교하면 25% 이상 향상되었으며, 50개 작업만 사전 학습한 모델과 비교하면 15% 향상되었습니다.
연구원들은 또한 다양한 시뮬레이션 작업에 대한 사전 교육이 장기적으로 복잡한 작업의 견고성을 향상시키는 것을 관찰했습니다. 예를 들어, GPT-4 사전 훈련된 모델은 실제 빌드휠 작업에서 더욱 강력한 성능을 보여줍니다.
절제 실험
시뮬레이션 훈련 성공률. 아래 표 2에서 연구원들은 200개의 데모를 통해 생성된 작업의 하위 집합에 대한 단일 작업 및 다중 작업 정책 교육의 성공률을 보여줍니다. GPT-4 세대 과제에 대한 정책훈련의 평균 과제 성공률은 단일 과제 75.8%, 다중 과제 74.1%이다.
작업 통계를 생성합니다. 아래 그림 9 (a)에서 연구원은 LLM에서 생성된 120개 작업의 다양한 기능에 대한 작업 통계를 보여줍니다. LLM 모델에서 생성된 색상, 자산, 작업 및 인스턴스 수 사이에는 흥미로운 균형이 있습니다. 예를 들어, 생성된 코드에는 7개 이상의 개체 인스턴스가 포함된 장면이 많이 포함되어 있을 뿐만 아니라 선택 및 배치 기본 동작과 블록과 같은 자산도 많이 포함되어 있습니다.
코드 생성 비교에서 연구진은 아래 그림 9(b)에서 GPT-4와 Code Llama의 하향식 실험에서 실패 사례를 정성적으로 평가했습니다
자세한 기술적인 내용은 원본 논문을 참고해주세요.
위 내용은 언어, 로봇 파괴, MIT 등은 GPT-4를 사용하여 시뮬레이션 작업을 생성하고 이를 현실 세계로 마이그레이션합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

iPhone이 가장 사용자 친화적인 전자 기기 중 하나라는 사실은 비밀이 아니며, 그 이유 중 하나는 원하는 대로 쉽게 개인화할 수 있다는 것입니다. 개인화에서는 iPhone을 설정할 때 선택한 언어와 다른 언어로 언어를 변경할 수 있습니다. 여러 언어에 익숙하거나 iPhone의 언어 설정이 잘못된 경우 아래 설명에 따라 변경할 수 있습니다. iPhone 언어 변경 방법 [3가지 방법] iOS를 사용하면 사용자가 iPhone에서 선호하는 언어를 자유롭게 전환하여 다양한 요구에 적응할 수 있습니다. Siri와의 상호 작용 언어를 변경하여 음성 지원과의 의사소통을 용이하게 할 수 있습니다. 동시에 로컬 키보드를 사용하면 여러 언어 간을 쉽게 전환하여 입력 효율성을 높일 수 있습니다.

기계력 보고서 편집자: 우신(Wu Xin) 국내판 휴머노이드 로봇+대형 모델팀이 옷 접기 등 복잡하고 유연한 재료의 작업 작업을 처음으로 완료했습니다. OpenAI 멀티모달 대형 모델을 접목한 Figure01이 공개되면서 국내 동종업체들의 관련 진전이 주목받고 있다. 바로 어제, 중국의 "1위 휴머노이드 로봇 주식"인 UBTECH는 Baidu Wenxin의 대형 모델과 긴밀하게 통합되어 몇 가지 흥미로운 새로운 기능을 보여주는 휴머노이드 로봇 WalkerS의 첫 번째 데모를 출시했습니다. 이제 Baidu Wenxin의 대형 모델 역량을 활용한 WalkerS의 모습은 이렇습니다. Figure01과 마찬가지로 WalkerS는 움직이지 않고 책상 뒤에 서서 일련의 작업을 완료합니다. 인간의 명령을 따르고 옷을 접을 수 있습니다.

산업자동화 기술 분야에서 최근 무시하기 어려운 두 핫스팟이 있는데 바로 인공지능(AI)과 엔비디아다. 원본 콘텐츠의 의미를 바꾸지 말고, 콘텐츠를 미세 조정하고, 콘텐츠를 다시 작성하고, 계속하지 마세요. “그뿐만 아니라 Nvidia가 원래 그래픽 처리 장치(GPU)에만 국한되지 않기 때문에 둘은 밀접하게 관련되어 있습니다. 엔비디아는 최근 GPU를 확장해 디지털 트윈 분야까지 확장하고 있으며, 최근 떠오르는 AI 기술과도 긴밀하게 연결돼 있다”고 말했다. Schneider Electric, Teradyne Robotics, MiR 및 Universal Robots 회사도 포함됩니다. 최근 엔비디아(Nvidia)는

휴머노이드 로봇 아메카가 2세대로 업그레이드 되었습니다! 최근 세계이동통신학회(MWC2024)에서 세계 최고 수준의 로봇 아메카(Ameca)가 다시 등장했다. 행사장 주변에는 아메카가 많은 관중을 끌어 모았습니다. GPT-4의 축복으로 Ameca는 다양한 문제에 실시간으로 대응할 수 있습니다. "춤을 추자." 감정이 있느냐는 질문에 아메카는 매우 생생해 보이는 일련의 표정으로 대답했습니다. 불과 며칠 전, Ameca의 뒤를 잇는 영국 로봇 회사인 EngineeredArts는 팀의 최신 개발 결과를 시연했습니다. 영상 속 로봇 아메카는 시각 능력을 갖고 있어 방 전체와 특정 사물을 보고 묘사할 수 있다. 가장 놀라운 점은 그녀도 할 수 있다는 것입니다.

이번 주, 오픈AI(OpenAI), 마이크로소프트(Microsoft), 베조스(Bezos), 엔비디아(Nvidia)가 투자한 로봇 회사인 FigureAI는 약 7억 달러의 자금 조달을 받았으며 내년 내에 독립적으로 걸을 수 있는 휴머노이드 로봇을 개발할 계획이라고 발표했습니다. 그리고 Tesla의 Optimus Prime은 계속해서 좋은 소식을 받았습니다. 올해가 휴머노이드 로봇이 폭발하는 해가 될 것이라는 데는 누구도 의심하지 않는다. 캐나다에 본사를 둔 로봇 회사인 SanctuaryAI는 최근 새로운 휴머노이드 로봇인 Phoenix를 출시했습니다. 관계자들은 이 로봇이 인간과 같은 속도로 자율적으로 많은 작업을 완료할 수 있다고 주장한다. 인간의 속도로 자동으로 작업을 완료할 수 있는 세계 최초의 로봇인 Pheonix는 각 물체를 부드럽게 잡고 움직이며 우아하게 왼쪽과 오른쪽에 배치할 수 있습니다. 자동으로 물체를 식별할 수 있습니다.

때로는 컴퓨터 시스템을 설치했는데 시스템이 영어로 되어 있는 경우가 있습니다. 이 경우 컴퓨터 언어를 중국어로 변경해야 합니다. 이제 win10 시스템에서 컴퓨터 언어를 중국어로 변경하는 방법을 알려주세요. . win10에서 컴퓨터 언어를 중국어로 변경하는 방법 1. 컴퓨터를 켜고 왼쪽 하단에 있는 시작 버튼을 클릭합니다. 2. 왼쪽의 설정 옵션을 클릭하세요. 3. 열리는 페이지에서 "시간 및 언어"를 선택합니다. 4. 연 후 왼쪽의 "언어"를 클릭합니다. 5. 여기에서 원하는 컴퓨터 언어를 설정할 수 있습니다.

눈 깜짝할 사이에 로봇이 마법을 배웠다고? 먼저 테이블 위의 물숟가락을 집어서 관객들에게 아무것도 없다는 것을 증명하는 모습이 보였고... 그리고 달걀 같은 물체를 손에 쥐고 다시 물숟가락을 테이블 위에 올려 놓았습니다. 그리고 "주문을 걸기" 시작했습니다... ...다시 물숟가락을 집었을 때 기적이 일어났습니다. 원래 넣었던 알은 사라지고, 튀어나온 것은 농구공으로 변해버렸는데... 연속적인 동작을 다시 살펴보자: △ 이 애니메이션은 2배속으로 일련의 동작을 보여주며, 보기만 해도 부드럽게 흘러간다. 0.5배속으로 반복해서 영상을 보면, 마침내 단서를 발견했습니다. 내 손의 속도가 더 빨랐다면 적에게 숨길 수도 있었을 것입니다. 일부 네티즌들은 로봇의 마법 실력이 자신보다 훨씬 높다고 한탄했습니다. 이 마법을 우리를 위해 수행한 사람은 매그였습니다.

쓸고 닦는 로봇은 최근 소비자들 사이에서 가장 인기 있는 스마트 가전제품 중 하나입니다. 그것이 가져오는 조작의 편리함, 심지어 조작이 필요하지 않은 것만으로도 게으른 사람들이 손을 자유롭게 할 수 있게 되어 소비자는 일상적인 집안일에서 "해방"되고 위장된 형태로 삶의 질이 향상됩니다. 이러한 열풍에 힘입어 시중에 나와 있는 거의 모든 가전제품 브랜드가 자체적으로 청소, 물걸레 로봇을 제작하고 있어 전체 청소, 물걸레 로봇 시장이 매우 활발해지고 있습니다. 그러나 시장의 급속한 확장은 필연적으로 숨겨진 위험을 가져올 것입니다. 많은 제조업체가 더 많은 시장 점유율을 빠르게 점유하기 위해 바다의 전술을 사용할 것이며 결과적으로 업그레이드 포인트 없이 많은 신제품이 나올 것이라고도 합니다. '마트료시카' 모델이라고 해도 과언이 아닙니다. 그러나 모든 청소 및 걸레질 로봇이 그런 것은 아닙니다.
