2026-02-10
ICRA 2026 にてワークショップ開催決定 ―視覚・言語・行動をつなぐロボット基盤モデル開発パイプラインと約1万時間のロボットデータを用いた国際コンペティションを同時開催―
モバイルマニピュレータの実ロボットデータ約1万時間を公開し、世界の研究者・エンジニアとともに「データから意思決定まで」の標準的なVLAパイプライン構築を目指す
弊協会は、2026年6月1日〜6月5日にオーストリア・ウィーンで開催される世界最大級のロボティクス国際会議「ICRA 2026」において、ワークショップ「From Data to Decisions: VLA Pipelines for Real Robots」の開催が採択されたことをお知らせします。
本ワークショップでは、視覚・言語・行動(VLA: Vision-Language-Action)モデルを実世界ロボットに適用するための「データから意思決定まで」のパイプラインに焦点を当て、2つのトラックを同時に実施します。
- VLAパイプラインに関するペーパーセッション(論文発表・ポスター)
- 約1万時間の実ロボットデータ(※)を用いたモバイルマニピュレーション・コンペティション
※約1万時間のロボットデータは、NEDO(国立研究開発法人新エネルギー・産業技術総合開発機構) の委託業務の結果得られたものです。
また、それぞれにおいて参加の公募を行います。
◼︎背景:VLAモデルと「データエンジン」の課題
近年、自然言語指示に従って多様なタスクをこなすロボットを実現するアプローチとして、Vision-Language-Action(VLA)モデルが急速に発展しています。一方で、データ収集コストやデータキュレーション(品質管理)、学習・評価の標準化、実環境での安全性・信頼性などといった「パイプライン全体」の設計については、未だベストプラクティスや共通指標が確立されていないのが現状です。
AIRoAは、実世界のロボットデータを軸にした「データエンジン」の構築とその公開を通じて、このギャップを埋めることを目指しています。
◼︎ワークショップ概要:From Data to Decisions: VLA Pipelines for Real Robots
- 名称:From Data to Decisions: VLA Pipelines for Real Robots
- 形式:フルデイ・ワークショップ(ICRA 2026 併設)
- URL:https://icra2026vlapipeline.github.io/
- 主な内容:
- 招待講演(データ収集・学習・評価・実運用に関する最先端の取り組み)
- パネルディスカッション「信頼できるVLAパイプラインをどう構築するか」
- ペーパーセッション(ライトニングトーク+ポスター)
- モバイルマニピュレーション・コンペティションの結果報告・受賞講演
◼︎本ワークショップの狙い
- VLAパイプラインの全体像(データ収集〜キュレーション〜学習〜推論〜評価)を整理する
- データ/評価プロトコル/ベースラインモデルなど、コミュニティで再利用可能な「実務的アーティファクト」を残す
- 産学の研究者・エンジニアが、実ロボットでのVLA活用に踏み出すための共通基盤をつくる
◼︎ペーパーセッション:VLAパイプラインに関する2ページ拡張アブストラクトを募集
本ワークショップでは、VLAパイプラインのいずれかの要素に関する2ページの論文を募集します。
- 対象トピック例
- 実ロボット/テレオペ/シミュレーション/Web動画を用いたデータ収集手法
- データキュレーション・前処理・アノテーションのベストプラクティス
- 事前学習・ファインチューニング・RL・補助目的などを含む学習戦略
- 汎化性能・安全性・ロバストネスを測る評価指標・ベンチマーク設計
- 実機展開時の推論・制御(レイテンシ・接触を伴うなど)
- 投稿形式:2ページ論文(シングルブラインド)
- 採択後の発表形態:
- ライトニング・スポットライト(6〜7分)
- ポスターセッション
- 一部は口頭発表枠(Contributed Talk)として選出
著者には、コード・設定ファイル・データレシピへのリンクの共有も推奨し、再現性の高い成果を積極的にアーカイブしていきます。採択論文やスライド、動画等は後日公開予定です。
ペーパーセッションについては、以下のフォームよりお申し込みください。
◼︎コンペティション:約1万時間の実ロボットデータを用いたモバイルマニピュレーション
本ワークショップのもう一つの柱が、モバイルマニピュレーションを対象としたVLAモデルの国際コンペティションです。
コンペ概要
- 対象タスク:
- ピック&プレース
- 物体挿入
- 可動オブジェクト(扉・引き出しなど)の操作
- 工具を用いた作業 など、接触を伴う多様なタスク群
- データセット:
- モバイルマニピュレータによる実ロボットデータ 約1万時間
- RGB-D映像、関節情報、力・トルクセンサ、言語アノテーション、行動軌跡などを含むマルチモーダルデータ
- LeRobotフォーマットで整備し、Wasabi等のストレージサービスを通して公開予定
- 評価プラットフォーム:
- トヨタ自動車の生活支援ロボット(HSR)」を用いた標準環境
- 実機による隔週評価
- 評価指標:
- 成功率
- タスク完了時間
- 環境変動へのロバスト性 など
- ベースライン:
- SmolVLA、π0 などの既存VLAモデルをベースとした公式ベースラインを公開し、参加チームはこれを起点に改善案を検証可能
- 賞金:
- 1位:2,000米ドル
- 2位:1,000米ドル
- 3位:600米ドル
受賞チームはワークショップ内で招待講演を行い、手法・アブレーション・失敗事例を共有
募集対象
- ロボット学習・強化学習・マルチモーダルモデルに取り組む研究室・企業研究所
- 産業現場での自律ロボット導入を見据えたPoCに取り組むエンジニアチーム
募集〆切
2026年 3月15日
実施スケジュール
- 2月14日 データセット公開
- 3月1日〜 隔週での評価スタート
- 4月15日 最終モデル提出
- 5月1日 採択結果の通知
コンペティション参加ご検討の方は、以下の特設ページよりご応募ください。
.png)