砍掉93%无效计算!清华等提出TaH架构,治好了小模型的“钻牛角尖”旧疾 大模型推理低效怎么破?清华大学等研发出TaH选择性潜空间迭代框架,直击Looped Transformer过度思考痛点。该方案通过轻量级决策器跳过93%的非必要迭代,将算力集于关键token,从而使小... AI 前沿动态# Looped Transformer# TaH# Think-at-Hard 2周前50
告别手脑脱节!卧安OneModel 1.7用一条隐式通路,让机器人看懂还能做对 具身智能面临世界模型看懂了但机器人做不对的痛点。卧安推出OneModel 1.7,通过隐式传导通路与RL机制打通这一断层。实测显示其在LIBERO达99%成功率,真机接乒乓球达91.2%,完成了从理解... AI 前沿动态# OneModel# 世界模型# 具身智能 2周前70
被AI终结的80年几何难题:OpenAI通用大模型如何重塑跨学科科学发现? OpenAI大模型自主推翻了困扰数学界近80年的埃尔德什单位距离猜想。针对离散几何长期停滞的难题,该模型抛弃定制化算法,而是运用代数数论构建全新几何对称空间,首次以通用AI身份独立解决核心数学未解之谜... AI 前沿动态# OpenAI# 埃尔德什猜想# 大模型 2周前110
生成效率狂飙5倍!谢赛宁团队发布RAEv2:彻底颠覆传统VAE的视觉表征革命 表征自编码器RAEv2针对传统VAE语义缺失、训练极其缓慢的痛点,通过多层特征融合与REPA空间结构互补机制,实现了5倍以上的收敛速度提升。这一全新方案以更低算力实现了更优秀的重建与生成效果,成功打通... AI 前沿动态# DINOv2# RAEv2# 扩散模型 2周前40
不买GPU暴涨15%算力!智谱落地ZCube闪击“降本死穴”,硬刚OpenAI网络新标 ZCube网络架构解决推理集群极易遭遇KV Cache传输导致的结构性网络阻滞痛点。智谱AI通过扁平化与混合路由设计推倒20年传统Clos组网,使线上大模型推理集群在0硬件改动下实现吞吐量暴涨15... AI 前沿动态# ZCube# 以太网芯片# 大模型推理 2周前80
告别盲目随机探索!国防科大等团队巧用“参数变化”,带强化学习走出训练深水区 强化学习无监督环境设计面临关卡价值评估开销大、方差高的痛点。国防科大等提出PACE算法,用策略参数变化量度量学习进展,精准定位最近发展区。实验显示该算法避开了额外评估开销,并在MiniGrid与Cra... AI 前沿动态# PACE算法# 强化学习# 无监督环境设计 2周前60
人形机器人迎来“中国心”!这个团队死磕898天,攻克灵巧手最难的核心件 空心杯电机作为具身智能领域的“指尖心脏”,长期面临海外垄断、国内采购价格高昂等痛点。上海马赫智造历时898天自研高精度产线正式投产,打破进口依赖,实现核心件本土稳定供货,助力中国具身智能产业链迈入自主... AI 前沿动态# 人形机器人# 具身智能# 灵巧手 2周前50
大模型套壳该收场了!五大顶级名校联手为AI智能体立宪,ToA理论如何终结玄学工程? AI智能体开发常陷入工程堆砌与调用失衡的痛点。爱丁堡与普林斯顿等顶尖高校正式提出ToA统一理论,将推理和行动重构为降低认知不确定性的资源分配问题。结论指出,智能体认知努力总量守恒,未来研发必须告别盲目... AI 前沿动态# AI智能体# ICML 2026# ToA理论 2周前40
告别繁杂工具流!Meta联合港中文提出ATLAS:用单个Token重塑低功耗视觉推理 Meta ATLAS视觉推理方案针对多模态大模型开销大、依赖工具的痛点,创新提出用单个Token统一Agent动作与隐式思考。该方案通过SFT与LA-GRPO机制,在不改动原架构下,显著降低推理成本... AI 前沿动态# ATLAS# LA-GRPO# 多模态大模型 2周前40
告别漫长等待!英伟达祭出首个“三合一”大模型,吞吐量暴涨4倍,长文本秒级生成时代来了 大语言模型解码速度慢如何解决?英伟达推出全球首个三模式LLM,无缝统一自回归与扩散机制,吞吐量提升高达4倍。该技术通过单模型自推理打破硬件瓶颈,实现在不同并发下的无感切换,宣告长文本秒级生成时代正式到... AI 前沿动态# Nemotron# 三模式大模型# 扩散模型 2周前60