0 个结果

暂无内容
5 个结果
AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025
从 Agent 前沿研究中一窥复制 Manus 的启示。 作者丨王悦编辑丨陈彩娴Manus 的出现将智能体推入当下 AI 格局的前列,使得这个过去略抽象的概念变得具体可感知。然而行业中也不乏对...

on 2025-04-18
万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025
Transformer架构的非递归设计阻碍了跨层的记忆共享,或限制模型泛化能力。 作者丨王悦 编辑丨陈彩娴 ...

on 2025-04-18
万字长文珍藏版:RL+Control 如何将机器人可靠性逼进 99.9%?丨 GAIR Live
真实世界,才是检验机器人 Learning 有效性的终极考场。 整理丨吴华秀 编辑丨陈彩娴...

on 2025-05-09