仅占3.2GB显存跑出90%真机成功率,上海交大这套新方案扯下了3D具身智能的“落地遮羞布” 具身智能VLA模型因缺乏空间感知导致精细操作易翻车。上海交大MINT团队推出Evo-Depth框架,以0.9B体量隐式编码三维深度。真机测试表明其成功率高达90%,且仅需3.2GB显存、12.3Hz低... AI 前沿动态# Evo-Depth# VLA模型# 具身智能 1周前50
手机电脑直接白嫖!仅0.5GB的无门槛小模型MiniCPM5-1B开源:附AI桌宠一键快速部署教程 MiniCPM5-1B是面壁智能最新发布的0.5GB端侧大模型,由纯AI自动编写的ForgeTrain框架训练而成。本文为您整理了MiniCPM5-1B本地专属AI桌宠一键快速部署攻略、开发者推理微调... AI 前沿动态# AI桌宠# ForgeTrain开源# MiniCPM5-1B 1周前50
别只顾着拼像素了!浙大阿里开源新架构,让AI学会“先三思后动笔” Unified Thinker图像生成推理方案攻克了扩散模型在复杂逻辑生成上的硬伤。针对AI绘制数独、模拟时间演变频频幻觉的痛点,浙大与阿里团队提出解耦思考与执行的模块化思维链架构,实测表明该方案能够... AI 前沿动态# Unified Thinker# 图像生成推理# 多模态大模型 1周前70
别再用视频生成忽悠人!港大小鹏端出新范式:给机器人的“大脑”直装物理直觉 具身智能VLA模型在动作控制与物理规律理解上长期存在痛点。港大小鹏提出DIAL框架,首创在原生ViT特征空间进行隐式世界建模。实验证实该方案仅需10%数据即可在RoboCasa基准超越传统SOTA,开... AI 前沿动态# DIAL框架# VLA模型# 具身智能 1周前50
别再给AI技能写“小说明书”了!龙虾之父教你用极简风格给Agent省Token Agent开发中技能描述过长导致Token暴涨且决策出错。本文剖析龙虾之父开源的skill-cleaner工具,通过对提示词预算审计、冗余清理与短动作词替代等三步法,实测将技能描述缩至40词内能显著提... AI 前沿动态# Agent开发# Token优化# 提示词工程 1周前50
大佬集体“降级”当员工?卡帕西们为什么涌向这个含金量超高的新头衔 Andrej Karpathy等顶级AI学者入职大厂却只挂名MTS技术员工,引发外界好奇。本文起底OpenAI与Anthropic推行的MTS体系,揭秘其在防挖人、去层级及破除领域壁垒上的商业逻辑,指... AI 前沿动态# Andrej Karpathy# Anthropic# MTS 1周前70
5秒改完3D场景且不崩坏,这个新算法凭什么把效率拉高了120倍? 3D场景编辑面临多视角不一致与速度慢的痛点。北京大学等多家机构打造原生的3D编辑算法VGGT-Edit,摒弃2D转换直接剪辑3D空间,利用残差场预测使单次修改仅用时5秒,渲染提速120倍且无穿帮,促进... AI 前沿动态# 3D场景编辑# VGGT-Edit# 三维重建 1周前50
免费开源!快手Keye-VL-2.0-30B大模型上线:手把手教你白嫖256K超长视频理解与代码Agent Keye-VL-2.0-30B-A3B是快手开源的全新一代多模态大模型底座。它引入了DSA机制以极低推理成本支持256K超长上下文,并首次解锁Code与Tool等Agent协作机制,提供优秀的时序因果... AI 前沿动态# Agent# Keye-VL-2.0# 多模态大模型 1周前50
世界模型一碰真车就“幻觉”?ECCV 2026这场顶级论战,要给具身智能装上安全阀 世界模型安全部署在真实物理世界中频发环境幻觉与长程失效。针对这一具身智能痛点,帝国理工、斯坦福等机构在ECCV 2026联合发起可信研讨会与挑战赛,聚焦安全预测与极端场景合成,加速弥合学术界与工业界落... AI 前沿动态# ECCV2026# 世界模型# 具身智能 1周前50
99%工作交给AI,人类仅花2小时:DeepSeek研究员用Agent写了篇46页的硬核论文 科研人员常受困于繁重的文献检索与论文执笔。DeepSeek研究员陈德里使用自研DeliAutoResearch工作流,协同V4-Pro仅耗费人类2小时脑力即完成了46页学术综述。这证实了L4级科研Ag... AI 前沿动态# AI智能体# DeepSeek# DeliAutoResearch 1周前50