ICML 2026新发现:大模型会自发形成“情绪树”,参数越大越懂人心! ICML 2026论文发现,大语言模型内部会自发形成类似人类情绪轮的层级结构,模型越大情绪树越复杂,并与识别准确率和偏见模式显著相关。 AI 前沿动态 3周前070
AI做游戏不该只靠Prompt抽卡:CreativeGame如何让玩法机制持续进化? CreativeGame通过机制规划、代理奖励和谱系记忆,让AI游戏生成从一次性Prompt输出走向可验证、可迭代的玩法进化。 AI 前沿动态 3周前070
Sutton团队新论文破解流式强化学习难题:一个1967年公式,让AI“边做边学”更稳定 Richard Sutton参与的新论文提出“意图更新”,用期望输出变化反推步长,在无回放、批量为1的流式强化学习中显著提升稳定性。 AI 前沿动态 3周前060
企业AI音乐迁移加速:为什么越来越多团队从Suno转向国产Mureka? 多家企业正在从Suno迁移到国产AI音乐Mureka。本文拆解Sondo、快歌和海外头部平台的选择逻辑,以及V8/V9如何推动AI音乐进入企业可用阶段。 AI 前沿动态 3周前070
Thinking Machines首个交互模型亮相:200ms微回合、实时多模态,向“一问一答”AI告别 Thinking Machines发布首个交互模型TML-Interaction-Small,以200ms微回合、早期多模态融合和后台agent实现实时自然协作。 AI 前沿动态 3周前070
Dexbotic接入RLinf:具身智能研发迎来“SFT+RL”一体化新范式 Dexbotic正式支持RLinf作为分布式强化学习后端,打通VLA模型SFT与RL后训练流程,推动具身智能研发走向一体化。 AI 前沿动态 3周前070
字节开源DreamLite:0.39B轻量统一扩散模型,手机上3秒完成生图与改图 字节开源DreamLite,0.39B轻量统一扩散模型可在手机端同时实现文生图与图像编辑,iPhone 17 Pro上约3秒出图,支持离线运行。 AI 前沿动态 3周前070
少步扩散模型也能持续进化:D-OPSD让图像生成实现“边采样边学习” D-OPSD将在线策略自蒸馏引入少步扩散模型,无需奖励模型即可在保持少步采样能力的同时学习新概念、新风格,支持LoRA与全量微调。 AI 前沿动态 3周前0120
推理为什么总卡顿?前谷歌 TPU 架构师拆解:算力之外,显存带宽、KV Cache 与并发才是关键 前谷歌 TPU 架构师 Reiner Pope 解析大模型推理为何会卡顿:显存带宽、批处理、KV Cache、长上下文和 MoE 通信墙如何共同限制速度与成本。 AI 前沿动态 3周前0120
arXiv祭出重拳:AI生成论文不核查直接封号一年,连坐所有作者 arXiv发布新规:若论文中AI生成内容未经核查(如虚构引用),将禁投一年,且后续需经同行评议。同时,多位AI顶会已出台类似惩罚措施,学术界对AI滥用进入实操治理阶段。 AI 前沿动态 3周前080