谷歌计划在 12 月推出名为「Project Jarvis」的大型动作模型,该模型将帮助用户执行各种任务,如收集研究、购买产品或预订航班等。这个工具将由未来版本的谷歌 Gemini 驱动,专门针对 Chrome 浏览器进行优化,可以通过截取屏幕截图、解析内容并自动点击按钮或输入文本来自动化日常的网页任务。不过,目前该工具在执行不同操作时会有几秒钟的间隔时间。同时,其他大型 AI 公司,如微软、苹果、Anthropic 和 OpenAI,也正在研发类似功能的模型。谷歌计划首先向少量测试者发布「Jarvis」,以帮助修复潜在的 Bug。