vla

🚀🚀🚀A collection of some awesome public projects about Large Language Model(LLM), Vision Language Model(VLM), Vision Language Action(VLA), AI Generated Content(AIGC), the related Datasets and Applications.

Updated Aug 1, 2025

InternRobotics / InternNav

Star

InternRobotics' open platform for building generalized navigation foundation models.

robotics navigation vla vlm visual-navigation spatial-ai vision-language-navigation mllms spatial-intelligence vision-language-action-model

Updated Mar 10, 2026
Jupyter Notebook

MIV-XJTU / FSDrive

Star

[NeurIPS 2025 spotlight] Official implementation for "FutureSightDrive: Thinking Visually with Spatio-Temporal CoT for Autonomous Driving"

autonomous-driving vla cot mllm world-model

Updated Sep 28, 2025
Python

SpatialVLA / SpatialVLA

Star

🔥 SpatialVLA: a spatial-enhanced vision-language-action model that is trained on 1.1 Million real robot episodes. Accepted at RSS 2025.

rss vla huggingface visual-language-action-model generalist-robot-policies rss2025

Updated Jun 23, 2025
Python

OpenDCAI / OpenWorldLib

Star

Unified Codebase for Advanced World Models.

simulator video-editing vla vlm world-models diffusion-models 3d-scene-generation world-model gaussian-splatting vggt hunyuan-world lingbot-world awesome-world-model

Updated Apr 8, 2026
Python

MIV-XJTU / JanusVLN

Star

[ICLR2026] Official implementation for "JanusVLN: Decoupling Semantics and Spatiality with Dual Implicit Memory for Vision-Language Navigation"

vla vln llm mllm

Updated Jan 26, 2026
Python

OpenBMB / DeepThinkVLA

Star

DeepThinkVLA: Enhancing Reasoning Capability of Vision-Language-Action Models

robotics rl vla reasoning-models

Updated Jan 19, 2026
Python

dexmal / realtime-vla

Star

Running VLA at 30Hz frame rate and 480Hz trajectory frequency

real-time vla pi0 4090

Updated Feb 10, 2026
Python

NVlabs / vla0

Star

VLA-0: Building State-of-the-Art VLAs with Zero Modification

robotics vla vlm

Updated Feb 21, 2026
Python

RenzKa / simlingo

Star

[CVPR 2025, Spotlight] SimLingo (CarLLava): Vision-Only Closed-Loop Autonomous Driving with Language-Action Alignment

autonomous-driving vla vlm carla

Updated Aug 25, 2025
Python

worldbench / awesome-vla-for-ad

Star

🌐 Vision-Language-Action Models for Autonomous Driving: Past, Present, and Future

awesome-list autonomous-driving multi-modal 3d vla self-driving vlm vision-language embodied-ai large-language-models llm multimodal-large-language-models vision-language-action vision-language-models

Updated Apr 8, 2026
HTML

phospho-app / phosphobot

Star

Control AI robots. Community-driven UI middleware for controlling robots, recording datasets, training action models. Compatible with SO-100 and SO-101

robotics vla phospho so100 so101