给视频生成装上“物理外脑”:NTU团队提出VChain,用视觉推理解决画面“穿帮”难题 视频生成模型常因缺乏物理常识导致画面穿帮。南洋理工大学团队推出VChain框架,首次引入“视觉思维链”机制。该方案利用多模态大模型进行逻辑推演并指导视频生成,在常识与因果规律测评中表现优异,零重训实现... AI 前沿动态# VChain# 多模态大模型# 大模型推理 3周前130
读懂音乐时间线到底有多难?复旦与字节联手打造GaMMA,多模态大模型终于学会“按秒听歌” 音乐时序理解一直是多模态大模型的致命短板。复旦联合字节推出GaMMA模型,创新采用双编码器融合网络与GRPO强化学习,让大模型真正读懂音乐时间线。实验表明,它在音乐结构拆解与时序任务上超越Gemini... AI 前沿动态# GaMMA# GRPO强化学习# 多模态大模型 3周前140
搜索框变成24小时智能体!谷歌I/O大会用Gemini 3.5 Flash掀起新风暴 Gemini 3.5 Flash正式发布,解决大模型高延迟与高成本的落地痛点。谷歌以此为核心全面重构搜索框与Workspace,将其升级为24小时不间断工作的智能体,这标志着大模型竞争已从跑分转入智能... AI 前沿动态# Gemini 3.5 Flash# Gemini Omni# 人工智能智能体 3周前130
让AI自己进化“外骨骼”!复旦联手北大开源AHE框架,刷爆榜单的底层技术长啥样? AHE自进化框架针对大模型Agent在长期工程中Harness难以手动调优的痛点,通过可观测性驱动,实现了端到端自动进化。复旦等团队实测表明,该方案助力GPT-5.4在基准测试上绝对提升7.3%,展现... AI 前沿动态# Agentic Harness# AHE框架# 复旦大学 3周前170
硬科技被困在“无人区”?看长三角如何用“并联游戏”打破产业化“死亡谷” 硬科技成果转化正面临“有先进技术却无配套产业链”的死亡谷困境。长三角通过“一条龙”计划打破传统串联式研发,构建“基础研究-中试-应用”的并联供需联盟,成功跑通合成生物、工业相机等无人区项目的闭环,为产... AI 前沿动态# 产业链协同# 合成生物# 成果转化 3周前130
告别一次性调优!同济等高校打破表格树大根深的高壁垒:OFA-TAD如何凭一个模型通吃金融与医疗跨域数据? 表格异常检测长期面临‘一个数据表训一次模型’的痛点。同济联合团队推出OFA-TAD框架,通过将表格数据翻译为语义无关的‘距离画像’并引入MoE自适应机制,成功实现免微调跨域部署,在34个数据集上斩获优... AI 前沿动态# OFA-TAD# 异常检测# 机器学习 3周前90
从OpenAI、DeepSeek到最热具身智能:追踪五年67位“字节奖学金”得主的AI激荡史 字节跳动奖学金正式启动2026全球申请!针对全球高校算力与经费告急的科研痛点,项目打破地域边界并增设导师配套资金。追踪历届67位获奖得主发现,他们已成为OpenAI、DeepSeek、生数科技、Met... AI 前沿动态# AI大模型# 人工智能科研# 具身智能 3周前120
拒绝对齐固定模板!清华与VAST用策略梯度赋予3D生成“自适应智商”,算力从此告别粗暴平摊 3D生成技术面临资源固定分配瓶颈。VAST与清华联合提出DeG新范式,将连续回归问题转化为可微分强化学习采样策略,实现非均匀的智能空间密度控制。实测表明,在画质接近的情况下,该模型可将高斯球算力成本削... AI 前沿动态# 3D生成# 3D高斯# DeG 3周前170
砍掉93%无效计算!清华等提出TaH架构,治好了小模型的“钻牛角尖”旧疾 大模型推理低效怎么破?清华大学等研发出TaH选择性潜空间迭代框架,直击Looped Transformer过度思考痛点。该方案通过轻量级决策器跳过93%的非必要迭代,将算力集于关键token,从而使小... AI 前沿动态# Looped Transformer# TaH# Think-at-Hard 3周前110
告别手脑脱节!卧安OneModel 1.7用一条隐式通路,让机器人看懂还能做对 具身智能面临世界模型看懂了但机器人做不对的痛点。卧安推出OneModel 1.7,通过隐式传导通路与RL机制打通这一断层。实测显示其在LIBERO达99%成功率,真机接乒乓球达91.2%,完成了从理解... AI 前沿动态# OneModel# 世界模型# 具身智能 3周前100