新京报客户端

好新闻 无止境

立即打开
OpenAI发布可独立操作电脑的智能体 智谱已“抢跑”
新京报 记者 罗亦丹 编辑 王进雨
2025-01-24 22:38

新京报贝壳财经讯(记者罗亦丹)北京时间1月24日,OpenAI首席执行官山姆·奥特曼现身直播间,演示了OpenAI的新智能体Operator(操作员)。根据演示,该智能体可以在用户向电脑端输入一段需求后,自动开始执行任务。用户即便“放开双手”,智能体也可以自动执行下去,其所有操作可以在桌面上显示。


OpenAI首席执行官山姆·奥特曼(左1)在直播中 来源:官方直播视频截图


例如,当直播人员在对话框中输入去某饭店订桌的需求后,Operator自动打开网页进入了预订网站,搜索到餐厅并完成了网上预订。而上传一张写有“鸡蛋、蘑菇”等食物的购物清单后,Operator就自动打开了浏览器去买菜网站上进行搜索并将这些食物放进了购物车。不过值得注意的是,在付款环节其会要求用户手动操作。


山姆·奥特曼表示,Operator的发布是OpenAI进入Level 3(等级三)的开始,在未来几周和几个月内还将推出更多智能体。根据此前OpenAI发布的“从人工智能到通用人工智能的五个等级”,等级三是智能体,等级四是可以进行创新的人工智能,等级五则是能够完成组织工作的人工智能。


不过,值得注意的是,在OpenAI发布Operator前一天,国内AI“六小虎”之一的智谱更新了其电脑智能体大模型GLM-PC(中文昵称为牛牛),该AI代理智能体早在去年11月就已经开放内测,并在今年1月23日进行了深度思考模式的更新。有开发者对贝壳财经记者表示,Operator在视频中所展示的内容,GLM-PC也完全可以做到。


二者的相同之处在于, 输入的模态(图像感知)、输出的操作空间(点击、滚动、输入)一致,并且都做了敏感性检测,让用户在敏感时刻(例如确认提交等)接盘操作,以及都有推理和一定程度的自反馈。不同之处在于,Operator现阶段主要针对网页,而GLM-PC针对电脑的任何操作(也包括浏览器)。


编辑 王进雨

校对 柳宝庆


来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
赋能科研全流程,智能科研平台ScienceOne发布
时事
智谱三大类模型开源,北京如何布局“开源之都”
科技
​视频大模型Vidu Q1官宣上线 每秒生成价格最低0.3元
科技
​实探|一夜爆火的Manus,背后团队是什么来头
科技
Manus引关注
北京
北京市去年数字经济增加值突破2.2万亿元,同比增长7.7%
北京
大模型震荡时刻:DeepSeek掀桌百度开源 免费成必答题
科技
“咖啡机器人”亮相中关村论坛的幕后:现制饮品的深度智能化
消费
人工智能群星闪耀时——探访北京“人工智能第一城”
北京
又一款中国现象级AI产品刷屏!Manus什么来头?
北京

新京报报料邮箱:67106710@bjnews.com.cn