【新卒_インターンシップ】VLA(Vision-Language Action models)のロバスト性、効率性、スケーラビリティ、および失敗回復に関する研究開発
実施会社:富士通株式会社
実施部署:富士通研究所 フィジカルAI研究所 ブレインインテリジェンス Group
募集職種:研究
想定期間:【3か月コース】2026年9月1日(火)~2026年11月27日(金)
インターンシップの業務内容やチームでの役割:
この研究テーマでは、Vision-Language Action models (VLAs) の実用的な応用を推進するための多角的なアプローチを追求します。具体的には、以下の主要な課題に取り組みます。
(1) ロバスト性評価と改善: VLAの言語、視覚、物体認識におけるロバスト性を定量的に評価する手法を確立し、既存VLAの性能を詳細に分析します。この分析に基づき、様々な環境変化やノイズに対するVLAの耐性を向上させる新たな手法を開発します。
(2) 効率的な学習手法の検討: 人間の労力を最小限に抑えつつ、VLAを特定のタスクに効率的に適応させるための学習手法を探究します。これには、効果的なサンプル探索や合成データ生成技術の活用が含まれます。
(3)VLAのスケールアップに関する研究開発: 小規模なVLAの能力を向上させ、より大規模なタスクへの適用を可能にするための研究を実施します。データ取得戦略、追加学習メカニズム、およびモデルアーキテクチャの観点から、VLAのスケーラビリティを向上させる手法を検討し、その適用範囲を拡大します。
(4)Failure Recoveryに基づくVLAの深化: VLAの失敗表現学習と回復戦略の最適化に焦点を当て、故障や予期せぬ状況に対するVLAの頑健性を強化します。この研究を通じて、実社会におけるPhysical AIの信頼性と安全性の向上を目指します。
これらの研究を通じて、VLAがより信頼性が高く、効率的で、幅広いシナリオで機能するようになることを目指します。