70 个结果
Rich Sutton 最新 WAIC 演讲:从数据时代到经验时代的 AI
整理丨梁丙鉴 编辑丨陈彩娴 AI 和人都站在两个时代之间的历史转折点上。 随着人类数据中可提取的知识迅速接近极限,Scaling Law 的终点已经隐约可见。今天的大语言模型可以编程、写诗,却仍无法独立发现新知。显而易见,真正的智能,呼唤着新的训练范式出现。 更迫切的问题关乎人自身。自古以来,智者们便试图理解人的心智如何运作。当这一原理终于要被探明,千年追求的终点前却不仅有期待,还有对 AI 的恐惧。站在 AI 智能水平可能超越人类的转折点上,我们要如何看待它?以及更关键的问题,如何看待自己? WAIC 2025 现场,现代强化学习的奠基人、阿尔伯塔大学教授 Rich Sutton 教授发表了题为《从数据时代到经验时代的 AI》的主旨演讲。Sutton 教授指出,学习源于强大的体验,而体验是心智活动的基础。智能体与世界的第一人称互动中,可能藏着一条通向超越人类智能的小径。 “经验时代”的概念由此而来。智能体对世界进行感知与交互,获取海量动态且高度定制化的数据,这种数据源将超越任何静态的合成数据生成程序,也更贴近生命的本质。就像 Sutton...

on 2025-09-04
WAIC最强亮点:非Transformer离线AI大模型已大规模量产,大模型商业比我们想得更快II
作者丨郭海惟 编辑丨陈彩娴 会自我学习自我生长的大模型。 智能离线内容可见上篇 2. 场景、场景,还是场景 “踩技术的坑”,只是RockAI过去一年两大“年度工作总结”中的一个。而比技术的坑更大的,则是“场景的坑”。 场景很难,邹佳思对AI科技评论说,演示和落地之间存在鸿沟,量产化落地难上加难。 假如说,Yan1.2部署在树莓派可以算得上一个写在公司手册里的里程碑事件。那么Yan1.3发布后,公司拿到了出海头部硬件公司的订单,则又算得上是业务里程的一大步。 邹佳思至今都记得,当合作伙伴把搭载着Yan1.3能力的PC拿给海外经销商的时候,合作伙伴的震动与兴奋。甚至一些实力雄厚的“巨头”友商代表,都专门到展台前面询问离线端侧功能是怎么实现的。 断网其实是一件比很多人想象得更重要的事情。 “离线端侧大模型在海外的需求是非常旺盛的”,邹佳思对AI科技评论表示,只是其中很多需求还没有获得最佳的解决方案。 首先,对于出海的硬件企业来说,海外关于信息安全的政策环境是很多样的。端侧可以规避大量信息传输、上云带来的政策风险与合规成本。...

on 2025-09-04
2025 上半年具身智能融资复盘:金额超 200 亿、头部收敛趋势明显、传统制造业巨头增多
作者丨丁莉 编辑丨陈彩娴 聚身智能成为新机遇?资本兴趣又面向何方? 时间进入7月,半个月来,国内具身智能领域共发生16起融资事件,几乎平均每天一起。仅7月8日一天内,就有6家公司官宣获得了新一轮投资。 将时间线进一步拉长,今年以来截至7月16日,AI科技评论以“具身智能”为标签在IT桔子上检索到融资事件共计130件。其中,已明确公布的融资金额共计96.68亿元;另有98件未公布明确金额的融资事件,从千万级到数亿元不等,如果再算上这一部分,预估整个具身智能领域上半年的总融资超过了 200亿人民币,甚至更多。 相关数字已远远超过 2024 年全年的 90 起融资 — — 89.33亿元融资金额。 去年涌向大模型的科技投资,今年开始掉转方向拥抱具身智能,但钱具体流向了哪里? AI科技评论梳理出的上半年融资金额与轮次最多、估值增长最突出的13家具身智能赛道头部公司,大多都选择了大脑与本体“两条腿走路”;在它们的资方构成中,大厂和传统制造巨头充当了重要角色。 资本日渐向头部企业聚拢,或将倒逼创新收敛,并把行业提前带到洗牌期。 Press enter or click to...

on 2025-09-04
最新 AGI 暴论:强化学习RL的「GPT-3 时刻」实现,还需要 1 万年?
「复制训练」或许是一条推动 RL 模型走向通用智能的重要路径。编译丨郑佳美编辑丨陈彩娴最近,国外一家 AI 初创公司 Mechanize 的三位创始人联合撰文,提出一个大胆的判断:RL 或许要迎来属于它的 “GPT-3 时刻”,但还需要拥有相当于数千至上万年“模型处理任务所用时间”的训练。在他们看来,当前的 RL 模型还存在明显短板,比如泛化能力差、难以适应新任务等,这种局面其实很像 GPT-3 出现之前的语言模型 — — 能解决特定问题,但难以迁移和扩展。为了解决这个问题,他们提出了一种新的训练范式,叫作“复制训练”(Replication Training):让模型在虚拟环境中模拟真实软件的操作过程,比如使用浏览器、编写代码、处理命令行任务等等。这种训练方式的好处在于任务目标清晰、评分机制明确,同时还能大规模自动生成训练数据,非常适合用在 RL 模型的系统性训练中。当然,它也不是万能的,比如在任务开放性和测试设计方面还有一些挑战。但他们认为,复制训练是一条能推动 RL 模型走向通用智能的重要路径,有望带来一次类似 GPT-3 那样的能力跃迁。综上,AI...

on 2025-09-04
大语言模型的新征程—— ACL 2025 顶会见闻前沿论坛实录|GAIR Live
ACL 投稿破 8000,大模型把计算语言学推向‘智能体’时代,三位顶级学者拆解 NLP 未来趋势。 作者丨岑峰 编辑丨陈彩娴 2025 年的 ACL(计算语言学协会)年会,无疑是大语言模型( LLM )持续主导 NLP 领域的又一里程碑。这不仅仅体现在学术研究的深度,更体现在会议本身的各项数据上 — — 史无前例的 8000 多篇投稿,其中中国作者的比例高达 51%。这一现象清晰地传递出大模型已成为 NLP 领域核心的信号,也标志着整个行业的格局正在发生深刻变化。 通过与多位参会者的沟通,我们得出这样的结论:大模型并未 “冲淡” 计算语言学的核心,反而在其技术框架下,为传统议题赋予了新的定义和呈现形式。同时,其多模态特性打破了传统的研究壁垒,吸引了来自计算机视觉、网络安全等不同领域的学者,使得 ACL 大会的氛围愈发跨学科。 为了深入剖析这一变革,雷峰网、AI 科技评论 GAIR Live 品牌特别邀请了三位杰出学者 — — 美国埃默里大学副教授刘菲、美国约翰霍普金斯大学助理教授肖超玮,以及中国科学院自动化研究所研究员张家俊,三位嘉宾从他们在 ACL...

on 2025-10-10
当智算变局到来,我们该如何 “用对” 算力?| GAIR Live016
当智算变局到来,我们该如何 “用对” 算力?| GAIR Live016 卡脖子的不是模型,是“用不对”的算力。 作者丨岑峰 编辑丨陈彩娴 2025 年的 AI 圈,终于从 “大模型崇拜” 走进了 “应用现实主义”。 当百度文心、阿里通义、腾讯混元等基础模型的参数竞赛告一段落,当 “百模大战” 变成 “百业应用”,企业们突然发现:曾经被当作 “基建” 的算力,成了应用落地的 “胜负手” — — 不是没有算力,而是找不到 “刚好能用” 的算力;不是算力不够,而是 “用不对地方” 的算力在浪费;不是买不起算力,而是 “不会用算力” 的成本在吞噬利润。 而 Oracle 与 OpenAI 签下 3000 亿美元的算力大单同样是行业变化的风向标:这不是简单的 “卖算力”,而是 “生态绑定”:OpenAI 需要 Oracle 的超大规模算力集群支撑 GPT-5 的训练与推理,Oracle 则通过绑定头部模型公司锁定未来十年的算力需求。这反映了全球算力市场的两个核心趋势: 其一是 “算力需求从集中走向爆发” 。大模型训练需要巨量算力(GPT-5 的训练算力是 GPT-3 的 10...

on 2025-10-10
AI PC,一场关于算力、场景与生态的远征
英特尔正通过其 XPU 混合架构、AI 算力以及开放的软件生态来引领这一趋势。 作者丨马晓宁 编辑丨陈彩娴 AI PC 市场的竞争正在升温,格局也在重塑。 无论是对于终端 AI 的讨论,还是智能硬件的热潮,其本质都是关于下一代计算入口的争夺,其底层逻辑是,将智能无缝融入个人设备,让 AI 从需要主动调用的工具,演变为随时待命、主动服务的环境能力。交互模式的改变,意味着我们需要重新定义终端的形态,而 PC 作为个人办公和娱乐的第一设备,就成为了必争之地。 这一趋势在9月25日2025抖音商城秋上新·琥珀流光上新大秀中,也可见一斑。 传统时装周的物理边界被彻底打破,取而代之的是无限延伸的数字景观;游牧诗人和极简高智等主题之下,模特穿梭于算法丛林,整体视觉既保留了秋日的温暖醇厚,又充满了数字时代特有的流动性与神秘感。 在线下展区,多项全新酷炫的技术产品一一展出,英特尔酷睿 Ultra 系列处理器,以及华硕、荣耀和联想三款搭载了酷睿 Ultra 处理器的新款 PC ,占据了全场焦点。 01. 芯片创新是核心生产力 英特尔正将 AI PC...

on 2025-10-15
对话 MoonBit 张宏波:为 AI 重构编程语言
AI Coding 最激进的拥趸,已经对编程语言下手了。 作者丨梁丙鉴 编辑丨马晓宁 “重构”是伴随大模型的热词之一。无数人喊出这个口号,朝着软件、公司乃至一个行业的既有模式摩拳擦掌。然而即使是这样的壮志也仍然没有触及变革的最底层,在应用层之前,张宏波认为,大模型首先应该要重塑的是编程语言本身。 来自美国的连续创业者 Nathan Baschez 近日在 X 上预言:「OpenAl 或 Anthropic 将在 TypeScript 上发布一种编程语言或框架」,原因是: 类型安全对 AI 编写和验证代码非常有帮助 现在人类不再愿意编写重复样板代码的限制已被打破 只有大型实验室才有预算从头构建训练数据脚手架 或许这则预言并非绝对准确。“相比 OpenAI 和 Anthropics,MSFT 和 Google 更有可能成为预言的主角。”张宏波告诉我们,“但市场对一门全新的 AI 原生编程语言的需求已经成为共识。”...

on 2025-10-16
从李飞飞直播到老黄女儿首秀:英伟达在下一盘什么大棋?
英伟达的下一幕:不谈 GPU,而谈「造世界」。 作者丨郑佳美 编辑丨马晓宁 最近,英伟达又成了话题中心。 短短几天里,接连两场看起来毫不相干的活动持续刷屏,一场是斯坦福教授李飞飞和英伟达首席科学家 Jim Fan 的直播,对谈主题是“让 AI 学会在世界里行动”,而另一场黄仁勋的女儿、英伟达产品营销高级总监 Madison Huang 首次公开亮相,与光轮智能(Lightwheel)创始人谢晨展开对话,共同探讨仿真、具身智能与 Sim2Real 的未来。 两场活动一边属于学术界的象征,一边则是产业界的未来接班力量。但当我们把它们放在一起看时,会发现它们其实讲述的是同一件事:英伟达正在全力推进它的仿真计算机战略。 这是黄仁勋为未来十年定下的方向:用 Omniverse、Isaac Sim 和 Physical AI 三大支柱,去构建一张贯穿虚拟与现实的“智能物理世界计算网”。简单来说,英伟达想要打造的不只是更强的算力,而是一套让 AI 能够“在世界中学习与行动”的系统,让机器不止能理解数据,而是真正学会理解世界本身。 英伟达正在下很大一盘棋。 01 三台「计算机」的新格局 ...

on 2025-10-21
具身智能的“生命线”:数据基石与未来路径 | GAIR Live 017
仿真合成数据是通往具身智能的必经之路。 作者丨岑峰 编辑丨马晓宁 如果说大模型的出现引爆了通用人工智能的想象,那么,具身智能则让 AI 拥有了可以感知、决策和行动的“身体”。而这一切的背后,都离不开一个至关重要的“生命线” — — 数据。 近日,雷峰网主办了一场主题为《具身智能数据:赋能感知、决策与控制的智能之源》的线上圆桌论坛,邀请了香港大学助理教授李弘扬、光轮智能联合创始人兼总裁杨海波、艾欧智能联合创始人、技术总监高飙三位重量级嘉宾,共同深入探讨了具身智能从数据采集、合成到闭环学习的全过程,为行业揭示了构建具身智能“生命线”的核心挑战与解决路径。 具身智能数据面临的挑战比传统 AI 领域更为严峻。嘉宾们一致认为,数据是构建“机器人基础模型”(Robotic Foundation Model)最关键的一环,但目前行业面临三大核心挑战:数据稀缺性与泛化能力、物理真实性与规模化短缺、商业与数据飞轮的脱钩。 针对真机数据的稀缺性和高门槛,嘉宾们分享了各自的独特解决方案: 李弘扬教授团队发布的 AgiBot World...

on 2025-10-29
相关文章