告别“废话连篇”的推理!浙大等提出Heima框架:大模型用3个隐式Token看懂世界 多模态大模型在依靠CoT推理时,文本冗长极易增加硬件解码延迟。为此,浙大等提出Heima推理框架,将复杂的显式步骤压缩成少数隐式思考Token。实测表明,该方案成功在隐空间实现极速探索,不仅免去了海量... AI 前沿动态# CoT压缩# Heima# ICML2026 2周前40
狂甩第二名30分!深度机智夺下物理AI新王座,具身智能的数据闭环拼图拼完了? 具身智能通用数据采集难度大、成本高。深度机智凭借Z-WM世界模型在WorldArena Track 2以88.5分断崖夺冠,彻底打通“合成数据直接训练机器人”的物理闭环。该成果证明以人类第一视角数据驱... AI 前沿动态# WorldArena# Z-WM# 世界模型 2周前40
降本90%性能却直追Opus 4.7!Cursor闪击发布Composer 2.5,背后竟藏着Kimi底座与马斯克的算力局 Cursor正式推出Composer 2.5模型,彻底解决AI编程工具成本高昂且长任务执行不稳定的痛点。新一代模型基于月之暗面K2.5构建,以十分之一的价格提供媲美Opus 4.7的超凡性能,重塑大模... AI 前沿动态# AI编程助手# Composer 2.5# Cursor 2周前50
大模型真的会吞噬一切吗?从王云鹤的「Harness」工程学看下一代AGI的“灵魂”之争 Harness工程学正成为破局单模型在长链高难任务中极易失效痛点的关键。本文提出多模型协同的参数化优化方案,将智能性价比目标函数化,结论前置指出未来AGI必由Model与Harness参数的迭代联合进... AI 前沿动态# AgentOS# AGI路径# Harness工程学 2周前70
长文本不再是显存黑洞!拆解 Gemma 4 等新一代大模型的结构调优术 KV Cache在大模型长上下文推理中导致显存急剧飙升。本文深度剖析Gemma 4的跨层KV通道共享与逐层嵌入(PLE)技术,解析Laguna XS.2如何通过动态Query Head分配实现按层注意... AI 前沿动态# Gemma 4# KV Cache# LLM架构 2周前50
不敲代码不靠工具,30B轻量模型凭什么狂飙10万Token冲上奥赛金牌线? SU-01是上海工智实验室推出的轻量级推理模型。面对大模型依赖外部工具进行复杂科学推理的局限性,SU-01跳过代码执行,采用反向困惑度课程微调与两阶段强化学习,仅凭自然语言完成超10万Token的深度... AI 前沿动态# SU-01# 上海人工智能实验室# 大模型 2周前80
拒绝“PPT式”3D重建!北航与新国立AmbiSuR如何攻克3DGS物理表面的终极死穴 3DGS表面重建中由于光度多义性常常导致几何崩塌与过度重建。北航与新加坡国立大学联合提出AmbiSuR框架,巧妙将球谐函数化为自指示器实施量化消歧。实验表明,该方法在DTU等多数据集上刷新精度纪录,真... AI 前沿动态# 3DGS# AmbiSuR# 三维重建 2周前50
全网疯找H100!新显卡明明已出货,上一代算力为何反而涨疯了? H100算力危机爆发,在中小团队面临租借暴涨与超长周期的痛点下,通过转向Spot实例、MoE架构及量化模型实现降本破局。分析指出,受台积电CoWoS与HBM3e产能限制,供应短缺可能将持续,AI竞赛正... AI 前沿动态# AI算力# CoWoS# H100 2周前60
别再用Token糊弄KPI了!硅谷Sierra与国内零犀正用“按效果付费”颠覆大模型商业化 RaaS(按效果付费)正成为解决企业AI落地痛点的全新商业范式。本文深度剖析硅谷独角兽Sierra与国内零犀科技的探索实践,展示AI如何从“卖Token的效率工具”演变为“直接交付业务结果”的数字劳动... AI 前沿动态# RaaS# Sierra# 因果AI 2周前60
前DeepMind研究员离职警示:限制大模型下一次飞跃的不是算力,而是终将崩溃的“评估系统” 大模型评估系统正面临失效危机。当模型跨入全新区间,静态基准将暗中失效。前DeepMind研究员Lun Wang指出,限制AI下一次飞跃的是评估而非算力。行业急需引入物理学中的‘序参量’预测智能相变,并... AI 前沿动态# AGI涌现# AI评测基准# DeepMind 2周前70