54 个结果
万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025
Transformer架构的非递归设计阻碍了跨层的记忆共享,或限制模型泛化能力。 作者丨王悦 编辑丨陈彩娴 ...

on 2025-04-18
挖掘「缝合」的潜力:CapaBench 揭示 LLM 智能体中各个模块的作用
CapaBench 是一个量化 LLM Agent 架构中各个模块贡献的评估框架。 作者丨AGI-Eval社区 ...

on 2025-04-18
整机厂也开始自研灵巧手,群狼环伺、鹿死谁手?
作为具身智能终局不可或缺的角色,灵巧手成了必争之地。 作者丨吴华秀 编辑丨陈彩娴 “最近有什么优秀的灵巧手项目可以聊聊吗?”这是自2024年下半年以来,投资人罗方最常问的一句话。...

on 2025-04-18
GRPO在《时空谜题》中击败o1、o3-mini和R1
GRPO训练的小型开源模型,推理能力逼近Sonnet 3.7。 作者丨洪雨欣 编辑丨陈彩娴 近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO...

on 2025-04-18
MIT 最新扩散模型课程:从微分方程探索 AIGC 的边界
揭秘扩散模型背后的数学理念。 作者丨洪雨欣 编辑丨陈彩娴 3 月 4 日,MIT 计算机系的教授 Peter Holderrieth 和 Ezra Erives 在 YouTube...

on 2025-04-18
南洋理工大学安波教授主页
安波 南洋理工大学校长讲席教授、人工智能系主任、人工智能交叉研究院院长; President's Chair ProfessorCollege of Computing and Data...

on 2025-04-25
DeckSpeed 严訸:创业的本质是对全世界的祛魅| 00后创业者系列
中国 00 后创业者发布「PPT 界的 Cursor」。 作者丨朱可轩 编辑丨陈彩娴 ...

on 2025-04-30
ICLR 2025:顶尖科学家最关心的 AI 趋势有哪些?丨GAIR Live
Scaling Law 走到尽头了吗?扩散模型会成为主流吗?通用 Agent 还有多久会来? 作者丨郑佳美、梁丙鉴 编辑丨马晓宁 ...

on 2025-04-30
阿德莱德大学吴琦:VLN 仍是 VLA 的未竟之战丨具身先锋十人谈
视觉导航不复杂,VLN却不容易。 作者丨赖文昕 编辑丨陈彩娴 2018 年 6 月,在澳大利亚机器人视觉研究中心(ACRV)做博士后研究员的吴琦和博士生 Peter Anderson 首次将...

on 2025-04-30
复旦大学团队提出跨模态越狱防御新架构 BlueSuffix
BlueSuffix 在保持良性样本性能的同时,有效降低了跨模态攻击成功率。 作者丨赵蕴涵...

on 2025-04-30