0 个结果

暂无内容
3 个结果
Pokee.ai 朱哲清:用 RL 搭建智能体的「骨骼与神经」| AI 产品十人谈
智能体,不是生成力,而是行动力。 作者丨郑佳美 编辑丨马晓宁 在 Pokee.ai 内测之前,我们就先感受了一把这款 Agent 的能力。 “你发给我一个邮件就行,我的 Agent...

on 2025-05-20
GuardAgent:首个专门为LLM agent提供安全Guardrail 的守卫型agent
本文由 UIUC 李博教授 (Virtue AI)领导,文章一作向臻曾于李博教授课题组担任博士后研究员,现任佐治亚大学计算机系助理教授。 近年来大型语言模型(LLM)发展迅速,从纯粹的对话工具变成可以自主执行任务的“智能体”(agent)。这些LLM agent正在被部署到各类现实场景中,如医疗问诊、金融分析、网页导航、自动驾驶等。它们可以调用外部工具、读取数据库、与网页交互,实现复杂的自动化流程。 然而,随之而来的却是日益严峻的安全和隐私挑战。一个没有安全限制的医疗agent,可能在无意中泄露患者敏感信息;一个自动化网页agent,可能在儿童使用时触发不合适的购买行为。传统的针对大模型本身的安全监护(Guardrail)主要用于检测文本输出中的有害内容,在处理文字时效果不错,但面对执行现实世界操作(如查询数据库、点击网页按钮)的LLM agent时,它们显得力不从心。这类agent需要的不是“文字审查”,而是真正理解上下文、能处理结构化安全请求的机制。 为此,来自佐治亚大学,UIUC大学等院校,联合AI安全公司Virtual AI的多位学者发布了GuardAgent ——...
CZ
on 2025-07-23
SimpAgent (ICCV2025 Highlight):上下⽂简化重塑GUI智能体,更少计算,更强性能
近年来,GUI智能体的发展正从依赖HTML、Accessibility树等⽂本解析的模式,逐步迈向基于截图感知的“纯视觉”范式。在多模态⼤模型(MLLM)的加持下,纯视觉GUI智能体展现出⽆需系统权限、泛化能⼒强、交互⾃然等优势,被视为未来通⽤操作智能体的重要⽅向。然⽽,这⼀新范式背后却暗藏困境:⾼密度、松散关联的元素上下⽂,以及冗余的历史上下⽂,正在制约GUI智能体在性能与效率上的平衡。 为此,哈⼯深和华为的研究者们从上下⽂简化建模的⻆度提出了SimpAgent,实现了更快更强的GUI智能体,该⼯作已被 ICCV 2025 录⽤为 Highlight 论⽂。 📄 论⽂地址:https://arxiv.org/abs/2507.03730 💻 代码仓库:https://github.com/JiuTian-VL/SimpAgent01 背景:从⽂本解析到纯视觉智能体,效率困境浮现...

on 2025-08-07