AKARI Tech Blog

燈株式会社のエンジニア・開発メンバーによる技術ブログです

世界モデル

世界モデルを活用してVLAのデータ収集の手間を減らそう

「世界モデルを活用し、ロボットがものごとに取り組むイメージ」で画像生成 はじめに Ctrl-World が取り組む課題 手法 問題の定式化 Ctrl-Worldの3つのキモ Multi-View Joint Predictions Pose-conditioned Memory Retrieval Mechanism Frame-level Action C…