新京报客户端

好新闻 无止境

立即打开
OpenAI发布可独立操作电脑的智能体 智谱已“抢跑”
新京报 记者 罗亦丹 编辑 王进雨
2025-01-24 22:38

新京报贝壳财经讯(记者罗亦丹)北京时间1月24日,OpenAI首席执行官山姆·奥特曼现身直播间,演示了OpenAI的新智能体Operator(操作员)。根据演示,该智能体可以在用户向电脑端输入一段需求后,自动开始执行任务。用户即便“放开双手”,智能体也可以自动执行下去,其所有操作可以在桌面上显示。


OpenAI首席执行官山姆·奥特曼(左1)在直播中 来源:官方直播视频截图


例如,当直播人员在对话框中输入去某饭店订桌的需求后,Operator自动打开网页进入了预订网站,搜索到餐厅并完成了网上预订。而上传一张写有“鸡蛋、蘑菇”等食物的购物清单后,Operator就自动打开了浏览器去买菜网站上进行搜索并将这些食物放进了购物车。不过值得注意的是,在付款环节其会要求用户手动操作。


山姆·奥特曼表示,Operator的发布是OpenAI进入Level 3(等级三)的开始,在未来几周和几个月内还将推出更多智能体。根据此前OpenAI发布的“从人工智能到通用人工智能的五个等级”,等级三是智能体,等级四是可以进行创新的人工智能,等级五则是能够完成组织工作的人工智能。


不过,值得注意的是,在OpenAI发布Operator前一天,国内AI“六小虎”之一的智谱更新了其电脑智能体大模型GLM-PC(中文昵称为牛牛),该AI代理智能体早在去年11月就已经开放内测,并在今年1月23日进行了深度思考模式的更新。有开发者对贝壳财经记者表示,Operator在视频中所展示的内容,GLM-PC也完全可以做到。


二者的相同之处在于, 输入的模态(图像感知)、输出的操作空间(点击、滚动、输入)一致,并且都做了敏感性检测,让用户在敏感时刻(例如确认提交等)接盘操作,以及都有推理和一定程度的自反馈。不同之处在于,Operator现阶段主要针对网页,而GLM-PC针对电脑的任何操作(也包括浏览器)。


编辑 王进雨

校对 柳宝庆


来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
“北京造”大模型GLM-4.5开源 综合性能世界领先
科技
AI浪潮录|周志峰:投资人需独立思考,在不确定性中锚定远方
科技
AI浪潮录|周志峰:北京AI优势根植于顶尖学府汇聚的科研沃土
科技
教育数字化深度融合,飞象星球五大产品协同亮相2025服贸会
教育
北京经开区率先打造高效办成一件事 基层新范式改革举措领跑全市
北京
“北京机会”释放千亿级吸引力,140个优质项目全球寻伙伴
北京
为海淀AI教育把脉,专家学者共议如何推进人工智能教育生态建设
教育
看“技术如何改变生活”,世界人工智能大会8项“镇馆之宝”亮相
财经
让痛点变通点 让细节更贴心!贵州以服务温度守护避暑旅游热度
新京号
“脑机接口”风口之下,喜临门“抢跑”AI睡眠
消费

新京报报料邮箱:67106710@bjnews.com.cn