谷歌发布 Gemini 2.5 Computer Use 模型:专攻浏览器交互
2025 年 10 月 8 日
谷歌正在预览全新的 Gemini 人工智能模型「Gemini 2.5 计算机使用」,该模型可通过浏览器浏览网络并交互,利用「视觉理解与推理能力」分析请求、完成任务,如填写提交表单。它可用于用户界面测试等,此前已应用于谷歌 AI 模式及「Mariner」项目。此次发布在 OpenAI 宣布推出 ChatGPT 新应用次日,OpenAI 聚焦「ChatGPT 智能体」功能,Anthropic 去年已发布 Claude AI 模型的「计算机使用」版本。谷歌发布演示视频,称其模型在多基准测试中优于现有方案,不过仅限于访问浏览器环境,目前支持 13 种操作。该模型已通过 Google AI Studio 和 Vertex AI 向开发者开放,Browserbase 平台提供在线演示。
2026-03-11
谷歌将 Gemini 引入办公套件,AI 可自动生成文档、表格和 PPT2026-03-04
谷歌推出 Gemini 3.1 Flash-LITE 模型2026-02-26
谷歌版豆包手机开始测试 Gemini 可以代替用户执行多步骤任务并自动操作2026-02-20
谷歌 Gemini 3.1 Pro 发布:推理能力翻倍,专为复杂任务而生2026-01-19
谷歌重申暂无在 Gemini 中投放广告计划,聚焦搜索广告2026-01-07
谷歌计划将 Gemini 引入智能电视 Apple TV 或将跟进2025-12-22
谷歌发布 A2UI 开放标准,实现 AI 代理实时生成图形界面2025-12-18
谷歌将「氛围编程」工具 Opal 集成至 Gemini 网页端查看更多
体验专业版特色功能,拓展更丰富、更全面的相关内容。