直接白嫖腾讯搞机神器!PhoneHarness 开源大礼包:全套工作流+顶级安全评测集免费领 腾讯混元联合多所高校推出PhoneHarness,首个突破GUI局限的手机Agent混合动作空间执行框架与评测基准。本文手把手带你获取开源代码、论文及HuggingFace数据集,一键开启系统级AI搞... AI 前沿动态# HuggingFace# PhoneHarness# 开源工具 1周前70
效率直接挂载10倍Buff!手把手教你如何用Agent组建一人公司 AI Agent实操教程助你摆脱大厂无意义内卷,用Planner、Builder及Reviewer三步法重构开发流。本指南手把手教你快速低成本将个人开发与交付效率直接提升10倍,轻松组建专属你的一人公... AI 前沿动态# 1人公司# AIAgent# CodingAgent 1周前70
仅占3.2GB显存跑出90%真机成功率,上海交大这套新方案扯下了3D具身智能的“落地遮羞布” 具身智能VLA模型因缺乏空间感知导致精细操作易翻车。上海交大MINT团队推出Evo-Depth框架,以0.9B体量隐式编码三维深度。真机测试表明其成功率高达90%,且仅需3.2GB显存、12.3Hz低... AI 前沿动态# Evo-Depth# VLA模型# 具身智能 1周前70
别再用视频生成忽悠人!港大小鹏端出新范式:给机器人的“大脑”直装物理直觉 具身智能VLA模型在动作控制与物理规律理解上长期存在痛点。港大小鹏提出DIAL框架,首创在原生ViT特征空间进行隐式世界建模。实验证实该方案仅需10%数据即可在RoboCasa基准超越传统SOTA,开... AI 前沿动态# DIAL框架# VLA模型# 具身智能 1周前70
5秒改完3D场景且不崩坏,这个新算法凭什么把效率拉高了120倍? 3D场景编辑面临多视角不一致与速度慢的痛点。北京大学等多家机构打造原生的3D编辑算法VGGT-Edit,摒弃2D转换直接剪辑3D空间,利用残差场预测使单次修改仅用时5秒,渲染提速120倍且无穿帮,促进... AI 前沿动态# 3D场景编辑# VGGT-Edit# 三维重建 1周前70
99%工作交给AI,人类仅花2小时:DeepSeek研究员用Agent写了篇46页的硬核论文 科研人员常受困于繁重的文献检索与论文执笔。DeepSeek研究员陈德里使用自研DeliAutoResearch工作流,协同V4-Pro仅耗费人类2小时脑力即完成了46页学术综述。这证实了L4级科研Ag... AI 前沿动态# AI智能体# DeepSeek# DeliAutoResearch 1周前70
别只盯着眼睛了!这家拿了近亿融资的复旦系黑马,要给机器人装上“手感” 触觉具身智能是解决机器人精细化操作失败痛点的关键。新智具身凭借自研视触觉传感器、千平数据采集中心及触觉大模型,构建出完整的端到端技术闭环。该公司近日完成近亿元天使轮融资,正加速推动工业级高精度装配场景... AI 前沿动态# 具身智能# 新智具身# 视触觉传感器 1周前70
别再疲于切换面板了!OneClickVirt 优雅终结混合虚拟化管理混乱 开源工具 OneClickVirt 是一款通用虚拟化管理平台,统一支持 Docker、LXD、Proxmox VE 及 KVM 等平台。项目提供高扩展性控制面板与超 200 API 自动化测试,全面覆... AI 前沿动态# Docker# GitHub# OneClickVirt 1周前70
用 Claude 写代码爽翻了,但怎么优雅地秀战绩?试试这款 AI 开发者脱敏画像神器 GitHub开源工具 Readme.skill 专为 AI-Native 开发者打造。它能自动读取本地 Claude 与 Codex 的统计数据及 GitHub 贡献,一键生成经过安全脱敏的中英双语 ... AI 前沿动态# AI开发者# Claude# GitHub 1周前70
这款 macOS 开源录屏工具有点狠:应用甚至察觉不到你在录屏 GitHub开源工具Himi Recorder面向macOS录屏场景,支持绕过系统录屏检测、菜单栏常驻、区域框选、60 FPS录制、预览编辑与快捷键操作。 AI 前沿动态# GitHub# Himi Recorder# macOS录屏 2周前70