微软 OmniParser 最新版本可将 DeepSeek 等模型变成 AI Agent
2025 年 2 月 17 日
微软发布了 OmniParser V2.0,这是一个视觉 Agent 解析框架,能将 DeepSeek-R1、GPT-4o 等模型转化为 AI Agent。与 V1 相比,V2 在检测小 UI 元素时准确率更高、推理速度更快,延迟降低 60%。在 ScreenSpot Pro 基准测试中,V2+GPT-4o 的准确率大幅提升至 39.6%。同时,微软还开源了 omnitool,一个基于 Docker 的 Windows 系统,用于屏幕理解、定位、动作规划和执行等功能,是将大模型转化为 Agent 的关键工具。
微软 OmniParser 最新版本可将 DeepSeek 等模型转化为计算机智能体
华尔街见闻 / 界面 / 财联社 / 钛媒体 / 网易科技 / 36Kr/i 黑马
DeepSeek 等秒变操控电脑 AI 智能体,微软开源工具 OmniParser V2.0 发布
凤凰科技 / C114 通信网
2026-04-15
微软发布新款图像生成模型 MAI-Image-2-Efficient2026-04-03
微软计划明年推出大型前沿 AI 模型 追求自主先进技术2026-02-27
微软发布 Copilot Tasks,推动生成式 AI 迈向自主代理阶段2026-01-27
微软推出下一代 AI 芯片 Maia 2002026-01-07
微软为 AI PC 上线独立「AI 组件更新日志」2025-12-10
微软 Excel 网页版全新「智能体模式」上线,AI 助力高效数据处理2025-11-25
微软推出计算机操作代理模型 Fara-7B2025-11-19
微软 Copilot AI 全面入驻 Office:助力办公效率升级2025-10-24
微软推出全新 AI 形象 Mico,Clippy 回归「变身」查看更多
体验专业版特色功能,拓展更丰富、更全面的相关内容。