Thinking Machines首个交互模型亮相:200ms微回合、实时多模态,向“一问一答”AI告别 Thinking Machines发布首个交互模型TML-Interaction-Small,以200ms微回合、早期多模态融合和后台agent实现实时自然协作。 AI 前沿动态 1个月前0110
Dexbotic接入RLinf:具身智能研发迎来“SFT+RL”一体化新范式 Dexbotic正式支持RLinf作为分布式强化学习后端,打通VLA模型SFT与RL后训练流程,推动具身智能研发走向一体化。 AI 前沿动态 1个月前0160
字节开源DreamLite:0.39B轻量统一扩散模型,手机上3秒完成生图与改图 字节开源DreamLite,0.39B轻量统一扩散模型可在手机端同时实现文生图与图像编辑,iPhone 17 Pro上约3秒出图,支持离线运行。 AI 前沿动态 1个月前0140
少步扩散模型也能持续进化:D-OPSD让图像生成实现“边采样边学习” D-OPSD将在线策略自蒸馏引入少步扩散模型,无需奖励模型即可在保持少步采样能力的同时学习新概念、新风格,支持LoRA与全量微调。 AI 前沿动态 1个月前0150
推理为什么总卡顿?前谷歌 TPU 架构师拆解:算力之外,显存带宽、KV Cache 与并发才是关键 前谷歌 TPU 架构师 Reiner Pope 解析大模型推理为何会卡顿:显存带宽、批处理、KV Cache、长上下文和 MoE 通信墙如何共同限制速度与成本。 AI 前沿动态 1个月前0230
arXiv祭出重拳:AI生成论文不核查直接封号一年,连坐所有作者 arXiv发布新规:若论文中AI生成内容未经核查(如虚构引用),将禁投一年,且后续需经同行评议。同时,多位AI顶会已出台类似惩罚措施,学术界对AI滥用进入实操治理阶段。 AI 前沿动态 1个月前0150
亚马逊内部KPI催生荒谬‘Tokenmaxxing’:员工为刷Token滥用AI工具! 亚马逊将Token消耗纳入KPI,员工为刷榜滥用AI工具,催生‘Tokenmaxxing’荒诞现象。背后是2000亿美元投资焦虑,还引发安全隐患。 AI 前沿动态 1个月前0150
从Agent到赛博员工:AI生产力智能的涌现与下一站竞争 当AI从“会干活”走向“真上岗”,赛博员工成为生产力新单位。本文解析Workspace-Bench测评揭示的Agent瓶颈,探讨工作站、角色与工作规模的Scaling新维度,以及生产力智能如何涌现。 AI 前沿动态 1个月前0160
AI分子设计的“世界模型”来了!诺奖团队中国成员打造全模态生成基座,已获pM级实验验证 一支源自2024诺贝尔化学奖实验室的中国团队,研发出ODesign全模态分子设计基座模型,实现蛋白质、核酸、小分子统一生成与跨模态迁移,在8个靶点获pM级亲和力验证,并创立英灵殿科技,推动AI4Bio... AI 前沿动态 1个月前0150
CMU联合港大港科发布PAT3D:从“能看”到“能模拟”,让AI生成3D场景真正物理稳定! CMU、HKU和HKUST联合提出PAT3D,通过物理仿真优化3D场景布局,实现视觉与物理双重合理性,支持编辑、动画和机器人仿真,论文已被ICLR 2026接收。 AI 前沿动态 1个月前0120