9B参数跑出全双工全模态!MiniCPM-o 4.5技术报告发布,RTX 5070即享类人AI助手 面壁智能发布MiniCPM-o 4.5技术报告,首次公开Omni-Flow流式全模态框架。9B模型实现端到端全双工交互,仅需11GB显存,RTX 5070即可本地部署,性能媲美Gemini 2.5 F... AI 前沿动态 4周前130
成本仅为GPT-5.5的1/370,DeepSeek-V4如何用“极致压缩”掀起AI效率革命? DeepSeek-V4发布,成本仅为GPT-5.5的1/370,通过CSA、HCA将百万上下文KV Cache压缩至2%,并深度适配昇腾芯片。本文从技术哲学、隐性代价、中美路线分化等角度深度解读其如何... AI 前沿动态 4周前130
文生图告别“参数玄学”:清华段岳圻团队用控制论重写CFG,画质与语义稳定双赢 清华大学段岳圻团队提出CFG-Ctrl,将文生图引导机制从经验调参升级为控制系统设计,利用滑模控制打破语义对齐与图像质量的传统对立,在高guidance scale下依然保持稳定,多模型实验验证其普适... AI 前沿动态 4周前130
CVPR 2026 多模态视觉新风向:不再“强行推理”,按需推理与评测体系重建成主线 CVPR 2026 多模态论文揭示视觉智能范式转变:从“始终推理”到按需推理,从选择题评测到开放问答,从单一图像理解到视频与精细定位,数据基础设施同步升级。 AI 前沿动态 4周前130
实测 Happy Horse-1.0:阿里首款视频模型如何让 AI“听懂戏”,拍出电影级质感? 阿里ATH事业群推出Happy Horse-1.0视频模型,在Arena和Artificial Analysis盲测中名列前茅。本文通过极限压力测试,全面评测其电影级叙事能力、多镜头一致性、音画同步... AI 前沿动态 4周前130
CVPR 2026|何恺明团队五连发:单步生成FID 1.72、归一化流加速700倍,流匹配全面挑战扩散霸权 何恺明团队在CVPR 2026连发五篇论文,覆盖流匹配单步生成、归一化流加速、纯视觉推理和像素自监督,多项指标刷新SOTA,无蒸馏单步FID达1.72,归一化流加速700倍,纯视觉模型推理能力比肩人类... AI 前沿动态 4周前130
从“看见”到“行动”:具身智能在CVPR 2026完成对计算机视觉的范式夺权 CVPR 2026上具身智能占据主舞台,本文从Ted Xiao的三大时代复盘切入,剖析具身智能如何重写视觉研究的问题定义、评价标准与技术路线,揭示从感知到行动的范式跃迁。 AI 前沿动态 4周前130
00后浙大博士创企连获两轮近亿元融资,华为联想联投,4D世界模型Scaling Law引关注 00后浙大博士陈天润创办的魔芯科技连续完成两轮近亿元融资,投资方包括华为哈勃、联想控股等。其4D世界模型采用纯隐式空间表示,在重建精度和动态支持上进入行业第一梯队。 AI 前沿动态 4周前130
对话关梦龙:用 Agent 拯救 100G 手机废片,AI 编导 Cutto 如何让每个人成为创作者? 前剪映早期成员关梦龙创业打造 AI 编导产品 Cutto,通过 Agent 架构让小白用户只需回答 4-5 个问题,3-5 分钟生成完整分镜脚本,将手机废片变为动人故事。本文深入对话关梦龙,探讨 AI... AI 前沿动态 4周前130
CVPR 2026观察:当AI学会“记忆”道路、“操作”游戏、“组队”协作 CVPR 2026涌现出多篇推动模型从感知走向决策的前沿研究,覆盖可控自动驾驶场景生成、仿真真实感增强、空间记忆增强、通用游戏操作基础模型、任意团队规模协作等方向,为具身智能和自主系统带来全新思路。 AI 前沿动态 4周前130