0 个结果

暂无内容
4 个结果
万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025
Transformer架构的非递归设计阻碍了跨层的记忆共享,或限制模型泛化能力。 作者丨王悦 编辑丨陈彩娴 ...

on 2025-04-18
部分国产芯片适配满血版 DeepSeek,仍「遥遥无期」
国内最强AI芯片公司,适配满血版DeepSeek的目标是25Tokens/s。 作者丨包永刚 编辑丨王亚峰...

on 2025-05-09
万字长文总结:DeepSeek 引发的 AI Infra 变革正在「加速」丨GAIR Live
AI Infra 洗牌进行时,追赶 DeepSeek 才能留在「牌桌」上。 作者丨朱可轩 编辑丨陈彩娴 DeepSeek 在进一步点燃 AI Infra 可能性的同时,也带来了新的竞争格局,在...

on 2025-05-16
3 个结果