OpenAI双响炮:40亿美元砸向企业AI部署,Daybreak上线打造网络防御新防线 OpenAI宣布成立部署公司,初始投资超40亿美元,收购Tomoro并派遣前沿部署工程师;同时推出网络防御工具Daybreak,加速漏洞发现与修复,重塑软件安全。 AI 前沿动态 3周前070
Auto Research 最后一块拼图:Frontier-Eng Bench 如何衡量 AI 的工程优化极限? Frontier-Eng Bench 是专为 AI 工程优化能力设计的基准,涵盖 47 个真实任务,测量 Agent 在固定预算内持续迭代改进方案的能力,揭示双重幂律衰减等规律。 AI 前沿动态 3周前070
告别反复踩坑!ModelScope开源自进化群体智能框架Ultron,让Agent经验永不丢失 ModelScope团队开源Ultron,通过Memory Hub、Skill Hub和Harness Hub实现Agent群体记忆自动沉淀、技能持续进化与专家画像一键分发,彻底告别重复试错和经验孤岛... AI 前沿动态 3周前070
OpenClaw 4.24重磅更新:接入DeepSeek V4,实时语音+浏览器自动化全面升级,但更新需谨慎! OpenClaw 4.24版本正式接入DeepSeek V4,带来实时语音回环、浏览器坐标点击等重大更新,但用户反馈更新稳定性存疑,建议谨慎升级。 AI 前沿动态 3周前070
开源即SOTA!Avenir-Web框架让网页智能体成功率飙升23.7%,三大模块破解长程任务难题 UCL、普林斯顿等联合推出Avenir-Web,开源Agent Harness框架在网页任务上取得53.7%成功率,超越闭源方案,三大模块破解元素定位难、缺乏流程知识、记忆不稳定等难题。 AI 前沿动态 3周前070
华为携中科大发布“灵境造物”:AI科学家终于学会“团队协作”,科研效率暴增 华为与中国科学技术大学联合发布“灵境造物”智能科研云平台,基于openJiuwen的协同工程让多AI智能体自主分工、沉淀经验并自演进,实现从理论到实验的全流程闭环,电催化剂筛选从数周缩至数小时。 AI 前沿动态 3周前070
GLM-5大规模推理踩坑实录:智谱如何揪出Scaling路上的隐形Bug 智谱公开GLM-5大规模Coding Agent推理中遇到的乱码、复读等异常,深入分析KV Cache复用冲突与read-before-ready问题,并提出同步机制与LayerSplit优化方案,提... AI 前沿动态 3周前070
1930年知识模型微调后竟能写代码?Talkie-1930-13b在SWE-bench上实现4.5%通过率 知识截止于1930年的talkie-1930-13b模型经过微调后,在SWE-bench上实现4.5% pass@1,并成功修复xarray库bug,引发对智能本质的讨论。 AI 前沿动态 3周前070
440MB离线翻译模型超越谷歌?腾讯混元Hy-MT1.5开源,手机秒变翻译神器! 腾讯混元开源Hy-MT1.5翻译模型,极致量化至440MB,离线手机运行,翻译质量超越谷歌,支持33种语言。 AI 前沿动态 3周前070
Anthropic颠覆AI对齐:中训练让模型失准率从68%暴跌至5% Anthropic提出模型规范中训练(MSM),在预训练后插入价值观教育,实验证明可将智能体失准率从68%降至5%,同时精简微调数据40-60倍。 AI 前沿动态 3周前070