Gairdao Community

Loading...

140 个结果

万字梳理：揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025

Transformer架构的非递归设计阻碍了跨层的记忆共享，或限制模型泛化能力。作者丨王悦编辑丨陈彩娴 ...

on 2025-04-18

挖掘「缝合」的潜力：CapaBench 揭示 LLM 智能体中各个模块的作用

CapaBench 是一个量化 LLM Agent 架构中各个模块贡献的评估框架。作者丨AGI-Eval社区 ...

on 2025-04-18

整机厂也开始自研灵巧手，群狼环伺、鹿死谁手？

作为具身智能终局不可或缺的角色，灵巧手成了必争之地。作者丨吴华秀编辑丨陈彩娴 “最近有什么优秀的灵巧手项目可以聊聊吗？”这是自2024年下半年以来，投资人罗方最常问的一句话。...

on 2025-04-18

GRPO在《时空谜题》中击败o1、o3-mini和R1

GRPO训练的小型开源模型，推理能力逼近Sonnet 3.7。作者丨洪雨欣编辑丨陈彩娴近日，海外大模型产品平台 OpenPipe 上发布了一项研究，阐述其如何通过 GRPO...

on 2025-04-18

MIT 最新扩散模型课程：从微分方程探索 AIGC 的边界

揭秘扩散模型背后的数学理念。作者丨洪雨欣编辑丨陈彩娴 3 月 4 日，MIT 计算机系的教授 Peter Holderrieth 和 Ezra Erives 在 YouTube...

on 2025-04-18

DeckSpeed 严訸：创业的本质是对全世界的祛魅｜ 00后创业者系列

中国 00 后创业者发布「PPT 界的 Cursor」。作者丨朱可轩编辑丨陈彩娴 ...

on 2025-04-30

ICLR 2025：顶尖科学家最关心的 AI 趋势有哪些？丨GAIR Live

Scaling Law 走到尽头了吗？扩散模型会成为主流吗？通用 Agent 还有多久会来？作者丨郑佳美、梁丙鉴编辑丨马晓宁 ...

on 2025-04-30

阿德莱德大学吴琦：VLN 仍是 VLA 的未竟之战丨具身先锋十人谈

视觉导航不复杂，VLN却不容易。作者丨赖文昕编辑丨陈彩娴 2018 年 6 月，在澳大利亚机器人视觉研究中心（ACRV）做博士后研究员的吴琦和博士生 Peter Anderson 首次将...

on 2025-04-30

复旦大学团队提出跨模态越狱防御新架构 BlueSuffix

BlueSuffix 在保持良性样本性能的同时，有效降低了跨模态攻击成功率。作者丨赵蕴涵...

on 2025-04-30

【 ICLR 2025 】Adam 有了 mini 版：内存减半，吞吐量可提升 50%

Adam-mini 在降低 50% 内存开销的同时保持了与 Adam 优化器相当甚至更优的性能。作者丨SRIBD 论文《Adam-mini: Use Fewer Learning Rates to...

on 2025-05-09

User Profile