文生图告别“参数玄学”:清华段岳圻团队用控制论重写CFG,画质与语义稳定双赢 清华大学段岳圻团队提出CFG-Ctrl,将文生图引导机制从经验调参升级为控制系统设计,利用滑模控制打破语义对齐与图像质量的传统对立,在高guidance scale下依然保持稳定,多模型实验验证其普适... AI 前沿动态 4周前130
CVPR 2026 多模态视觉新风向:不再“强行推理”,按需推理与评测体系重建成主线 CVPR 2026 多模态论文揭示视觉智能范式转变:从“始终推理”到按需推理,从选择题评测到开放问答,从单一图像理解到视频与精细定位,数据基础设施同步升级。 AI 前沿动态 4周前130
实测 Happy Horse-1.0:阿里首款视频模型如何让 AI“听懂戏”,拍出电影级质感? 阿里ATH事业群推出Happy Horse-1.0视频模型,在Arena和Artificial Analysis盲测中名列前茅。本文通过极限压力测试,全面评测其电影级叙事能力、多镜头一致性、音画同步... AI 前沿动态 4周前130
CVPR 2026|何恺明团队五连发:单步生成FID 1.72、归一化流加速700倍,流匹配全面挑战扩散霸权 何恺明团队在CVPR 2026连发五篇论文,覆盖流匹配单步生成、归一化流加速、纯视觉推理和像素自监督,多项指标刷新SOTA,无蒸馏单步FID达1.72,归一化流加速700倍,纯视觉模型推理能力比肩人类... AI 前沿动态 4周前130
从“看见”到“行动”:具身智能在CVPR 2026完成对计算机视觉的范式夺权 CVPR 2026上具身智能占据主舞台,本文从Ted Xiao的三大时代复盘切入,剖析具身智能如何重写视觉研究的问题定义、评价标准与技术路线,揭示从感知到行动的范式跃迁。 AI 前沿动态 4周前130
00后浙大博士创企连获两轮近亿元融资,华为联想联投,4D世界模型Scaling Law引关注 00后浙大博士陈天润创办的魔芯科技连续完成两轮近亿元融资,投资方包括华为哈勃、联想控股等。其4D世界模型采用纯隐式空间表示,在重建精度和动态支持上进入行业第一梯队。 AI 前沿动态 4周前130
对话关梦龙:用 Agent 拯救 100G 手机废片,AI 编导 Cutto 如何让每个人成为创作者? 前剪映早期成员关梦龙创业打造 AI 编导产品 Cutto,通过 Agent 架构让小白用户只需回答 4-5 个问题,3-5 分钟生成完整分镜脚本,将手机废片变为动人故事。本文深入对话关梦龙,探讨 AI... AI 前沿动态 4周前130
CVPR 2026观察:当AI学会“记忆”道路、“操作”游戏、“组队”协作 CVPR 2026涌现出多篇推动模型从感知走向决策的前沿研究,覆盖可控自动驾驶场景生成、仿真真实感增强、空间记忆增强、通用游戏操作基础模型、任意团队规模协作等方向,为具身智能和自主系统带来全新思路。 AI 前沿动态 4周前130
少步扩散模型也能持续进化:D-OPSD让图像生成实现“边采样边学习” D-OPSD将在线策略自蒸馏引入少步扩散模型,无需奖励模型即可在保持少步采样能力的同时学习新概念、新风格,支持LoRA与全量微调。 AI 前沿动态 4周前0130
从Agent到赛博员工:AI生产力智能的涌现与下一站竞争 当AI从“会干活”走向“真上岗”,赛博员工成为生产力新单位。本文解析Workspace-Bench测评揭示的Agent瓶颈,探讨工作站、角色与工作规模的Scaling新维度,以及生产力智能如何涌现。 AI 前沿动态 4周前0130