iPhone 17 Pro也能跑近400B大模型?Flash-MoE把端侧AI推到新极限 Flash-MoE让接近400B的MoE大模型在iPhone 17 Pro上跑通,虽仅0.6 tok/s,却验证了端侧超大模型的可行性。 AI 前沿动态 3周前0120
ACL 2026新方案RouteMoA:不等模型先回答,动态路由让多智能体协作更快更省 RouteMoA 提出无需预推理的动态路由机制,通过先验预测与低成本修正优化多智能体协作,在15模型池实验中显著降低成本和延迟。 AI 前沿动态 3周前070
CVPR 2026 重磅亮点:LEADER 让激光雷达重定位同时拿下精度与速度 厦门大学与布里斯托大学提出 LEADER 激光雷达重定位方法,在保持十毫秒级效率的同时显著提升精度,NCLT 上优于 APR、SCR 和检索配准方法。 AI 前沿动态 3周前0180
黄仁勋罕见发声:别把AI说成“灭世工具”,就业和SaaS都没那么简单 黄仁勋罕见批评AI极端叙事,点名Anthropic CEO Dario Amodei,反对“AI灭世论”和夸张失业预测,并分析SaaS行业真实影响。 AI 前沿动态 3周前0110
MoE路由也能“长记性”:RMS-MoE用历史专家协作降低推理成本 WWW 2026论文RMS-MoE提出检索记忆协同路由,让MoE复用历史专家组合,在WebQA和MultiWOZ上提升准确率并降低延迟。 AI 前沿动态 3周前090
从 Qwen3-VL 到 BARD-VL:上智院联手复旦开源多模态扩散模型,解码吞吐最高提升 3 倍! 上智院联合复旦等开源 BARD-VL,通过桥接框架将自回归 VLM 平滑转为扩散 VLM,兼顾性能与效率,实测解码吞吐最高提升 3 倍。 AI 前沿动态 3周前090
VLA研究迎来统一底座:港科大与社区开源StarVLA,主流机器人模型终于能公平对比了 港科大与开源社区推出StarVLA,将主流VLA主干、动作头、训练策略和评估基准统一到同一框架,推动机器人模型公平对比与可复现研究。 AI 前沿动态 3周前070
OpenAI Codex正式登陆ChatGPT手机App:免费用户也能随时审批代码,AI开发协作进入移动时代 OpenAI宣布Codex正式进入ChatGPT移动App,iOS和Android预览上线,免费用户也可使用。支持手机审批代码、查看运行状态、远程SSH连接与团队协作。 AI 前沿动态 3周前0130
万帧级照片级仿真来了!GS-Playground如何重塑视觉机器人训练基础设施 清华AIR等团队提出GS-Playground,以3DGS渲染、自研物理引擎和自动化资产流水线实现万帧级照片级机器人仿真。 AI 前沿动态 3周前090
OpenAI 官方 CLI 正式登场:命令行也能直接调用最新模型,开发效率再升级 OpenAI 推出官方命令行工具 openai-cli,支持 Responses、云端工具、图像、语音与项目配置,帮助开发者在终端中更高效调用模型。 AI 前沿动态 3周前090