GAIR Live 09 : 具身智能之 VLA 的实践与突破
2025年,全球具身智能产业规模突破百亿美元,以视觉-语言-动作(VLA)为核心的技术正加速渗透机器人、自动驾驶、工业自动化等领域。
海内外团队的 VLA 成果频频涌现,如Physical Intelligence 的 π0.5 模型、Figure发布的Helix与清华的 RDT 等等,VLA 技术正从实验室走向产业深水区。然而,技术收敛度、数据稀缺、算力瓶颈等挑战仍横亘在前。
5月8日14:00,AI 科技评论邀请了来自北京大学、清华大学的 5 位兼具学界前沿洞察与产业实战经验的青年科学家,围绕 VLA 技术的核心突破、场景落地与未来十年技术路径展开线上深度对话,为从业者提供从理论到实践的完整认知地图。
技术的突破从不源于闭门造车,而是开放碰撞的火花。
https://youtu.be/rHKVsM_3C5s