降本90%性能却直追Opus 4.7!Cursor闪击发布Composer 2.5,背后竟藏着Kimi底座与马斯克的算力局 Cursor正式推出Composer 2.5模型,彻底解决AI编程工具成本高昂且长任务执行不稳定的痛点。新一代模型基于月之暗面K2.5构建,以十分之一的价格提供媲美Opus 4.7的超凡性能,重塑大模... AI 前沿动态# AI编程助手# Composer 2.5# Cursor 3周前100
大模型真的会吞噬一切吗?从王云鹤的「Harness」工程学看下一代AGI的“灵魂”之争 Harness工程学正成为破局单模型在长链高难任务中极易失效痛点的关键。本文提出多模型协同的参数化优化方案,将智能性价比目标函数化,结论前置指出未来AGI必由Model与Harness参数的迭代联合进... AI 前沿动态# AgentOS# AGI路径# Harness工程学 3周前130
长文本不再是显存黑洞!拆解 Gemma 4 等新一代大模型的结构调优术 KV Cache在大模型长上下文推理中导致显存急剧飙升。本文深度剖析Gemma 4的跨层KV通道共享与逐层嵌入(PLE)技术,解析Laguna XS.2如何通过动态Query Head分配实现按层注意... AI 前沿动态# Gemma 4# KV Cache# LLM架构 3周前150
不敲代码不靠工具,30B轻量模型凭什么狂飙10万Token冲上奥赛金牌线? SU-01是上海工智实验室推出的轻量级推理模型。面对大模型依赖外部工具进行复杂科学推理的局限性,SU-01跳过代码执行,采用反向困惑度课程微调与两阶段强化学习,仅凭自然语言完成超10万Token的深度... AI 前沿动态# SU-01# 上海人工智能实验室# 大模型 3周前110
拒绝“PPT式”3D重建!北航与新国立AmbiSuR如何攻克3DGS物理表面的终极死穴 3DGS表面重建中由于光度多义性常常导致几何崩塌与过度重建。北航与新加坡国立大学联合提出AmbiSuR框架,巧妙将球谐函数化为自指示器实施量化消歧。实验表明,该方法在DTU等多数据集上刷新精度纪录,真... AI 前沿动态# 3DGS# AmbiSuR# 三维重建 3周前110
全网疯找H100!新显卡明明已出货,上一代算力为何反而涨疯了? H100算力危机爆发,在中小团队面临租借暴涨与超长周期的痛点下,通过转向Spot实例、MoE架构及量化模型实现降本破局。分析指出,受台积电CoWoS与HBM3e产能限制,供应短缺可能将持续,AI竞赛正... AI 前沿动态# AI算力# CoWoS# H100 3周前150
别再用Token糊弄KPI了!硅谷Sierra与国内零犀正用“按效果付费”颠覆大模型商业化 RaaS(按效果付费)正成为解决企业AI落地痛点的全新商业范式。本文深度剖析硅谷独角兽Sierra与国内零犀科技的探索实践,展示AI如何从“卖Token的效率工具”演变为“直接交付业务结果”的数字劳动... AI 前沿动态# RaaS# Sierra# 因果AI 3周前120
前DeepMind研究员离职警示:限制大模型下一次飞跃的不是算力,而是终将崩溃的“评估系统” 大模型评估系统正面临失效危机。当模型跨入全新区间,静态基准将暗中失效。前DeepMind研究员Lun Wang指出,限制AI下一次飞跃的是评估而非算力。行业急需引入物理学中的‘序参量’预测智能相变,并... AI 前沿动态# AGI涌现# AI评测基准# DeepMind 3周前100
干掉冗长串行,小红书开源HyperEyes让多目标搜索效率飙升5倍 多模态搜索智能体常陷入串行处理的慢速泥沼。HyperEyes研究团队提出并行搜索新范式,通过统一定位即搜索与双粒度强化学习,将多实体检索耗时缩短至五分之一。实验表明该架构在多实体评估集上实现准确与效率... AI 前沿动态# HyperEyes# 多模态意图# 多目标搜索 3周前160
硅谷AI圈超级大转会!Andrej Karpathy官宣入职Anthropic,背后的技术棋局更耐人寻味 Karpathy宣布加盟Anthropic。面对大模型算力瓶颈与预训练效率难题,他将带领新团队利用Claude实现“用AI加速AI”的自主迭代,这标志着顶尖人才的争夺战再次升级,也将彻底改写硅谷大模型... AI 前沿动态# Anthropic# Claude# Karpathy 3周前110