多步预测总翻车?北大团队揪出MSE两大“原罪”,让损失函数自我进化 | ICLR 2026 北大林宙辰团队在ICLR 2026提出QDF方法,指出传统MSE损失的两个错误先验,并通过元学习让损失函数自适应调整,显著改善多步时序预测的长期误差,无需改动模型结构。 AI 前沿动态# ICLR 2026# QDF# 元学习 1个月前160
红杉领投数亿元!智元旗下觅蜂科技获融资,解密具身智能「孵化-独立」模式 智元旗下具身智能数据平台觅蜂科技完成数亿元融资,红杉领投。解析智元‘孵化-独立融资’模式及其三大优势。 AI 前沿动态# 具身智能# 孵化模式# 数据平台 1个月前160
多跳推理性能飙升20%!Search-R2将纠错纳入策略空间,破解搜索增强推理的长链信用分配难题 腾讯混元、MBZUAI和港中文联合提出Search-R2框架,将纠错纳入强化学习策略空间,有效解决长链搜索推理中的错误传播问题,在多跳推理任务中性能提升超20%,为搜索型智能体提供了更贴近真实失败模式... AI 前沿动态# MBZUAI# Search-R2# 信用分配 1个月前140
AI Agent的“斯坦利时刻”:告别基准高分幻觉,直面职场执行鸿沟 Trainee-Bench通过模拟真实职场,从动态调度、主动探索、持续学习三维度评估AI Agent,结果显示顶尖模型成功率不足35%,并发任务下性能骤降,甚至出现“记吃不记打”的反常现象。 AI 前沿动态# AI agent# Trainee-Bench# 动态调度 1个月前150
AI不再“近视眼”:上交大&蚂蚁提出R2I蒸馏,单次推理实现细粒度感知,速度提升10倍 上海交通大学与蚂蚁集团联合提出Region-to-Image Distillation方法,让多模态大模型无需反复缩放即可实现细粒度视觉感知,性能超越Kimi-K2.5等大模型,速度提升10倍。 AI 前沿动态# AI视觉# ZwZ# 区域到图像蒸馏 1个月前150
ICLR 2026 | 清华刘洋团队震撼发现:8B小模型问诊吊打70B大模型,医疗AI的真正救命能力原来不是背书! 清华刘洋团队在ICLR2026发表重磅论文,提出DOCTOR-R1框架,用8B小模型在动态问诊中超越70B大模型,揭示医疗AI的真正瓶颈在于提问策略而非知识规模。 AI 前沿动态# 8B模型# DOCTOR-R1# ICLR2026 1个月前190
原力灵机范浩强:评判机器人好坏的唯一指标,是它多久能回本 原力灵机联合创始人范浩强在访谈中提出,评判机器人好坏的唯一指标是它多久能回本。本文深入探讨了具身智能真实场景的落地挑战,以及原力灵机如何通过开源模型与硬件闭环,从百里挑一走向无限泛化。 AI 前沿动态# DFOL# RoboChallenge# 具身智能 1个月前170
AI从“做事”进化到“规划人生”:NOOK创始人详解如何用玄学+游戏化打造“人生外挂” NOOK是一款融合玄学与游戏化的AI人生规划应用,通过Life Copilot将目标拆解为每日任务,用数值反馈驱动年轻人行动。创始人许清岚详解从“做事”到“规划人生”的AI进化路径。 AI 前沿动态# Agent# AI人生规划# AI情商 1个月前240
除夕炸场!阿里千问3.5 Plus发布:3970亿参数仅激活170亿,性能超越GPT-5.2,API价格仅为Gemini的1/18 除夕当天阿里发布Qwen3.5-Plus,3970亿参数仅激活170亿,性能超越GPT-5.2和Gemini-3-pro,API价格仅为Gemini的1/18,全栈自研打破AI不可能三角。 AI 前沿动态# API价格# Gemini# GPT 1个月前160
从春晚“倒酒”看具身智能商业化:技术、场景与“三重门”突围战 从春晚机器人跳舞、倒酒切入,深度解析具身智能商业化的核心能力、场景落地路径和必须跨越的量产、生态、全球化三座大山,揭示中国具身智能产业的商业化进程。 AI 前沿动态# 全球化# 具身智能# 春晚机器人 1个月前180