新京报客户端

好新闻 无止境

立即打开
OpenAI发布可独立操作电脑的智能体 智谱已“抢跑”
新京报 记者 罗亦丹 编辑 王进雨
2025-01-24 22:38

新京报贝壳财经讯(记者罗亦丹)北京时间1月24日,OpenAI首席执行官山姆·奥特曼现身直播间,演示了OpenAI的新智能体Operator(操作员)。根据演示,该智能体可以在用户向电脑端输入一段需求后,自动开始执行任务。用户即便“放开双手”,智能体也可以自动执行下去,其所有操作可以在桌面上显示。


OpenAI首席执行官山姆·奥特曼(左1)在直播中 来源:官方直播视频截图


例如,当直播人员在对话框中输入去某饭店订桌的需求后,Operator自动打开网页进入了预订网站,搜索到餐厅并完成了网上预订。而上传一张写有“鸡蛋、蘑菇”等食物的购物清单后,Operator就自动打开了浏览器去买菜网站上进行搜索并将这些食物放进了购物车。不过值得注意的是,在付款环节其会要求用户手动操作。


山姆·奥特曼表示,Operator的发布是OpenAI进入Level 3(等级三)的开始,在未来几周和几个月内还将推出更多智能体。根据此前OpenAI发布的“从人工智能到通用人工智能的五个等级”,等级三是智能体,等级四是可以进行创新的人工智能,等级五则是能够完成组织工作的人工智能。


不过,值得注意的是,在OpenAI发布Operator前一天,国内AI“六小虎”之一的智谱更新了其电脑智能体大模型GLM-PC(中文昵称为牛牛),该AI代理智能体早在去年11月就已经开放内测,并在今年1月23日进行了深度思考模式的更新。有开发者对贝壳财经记者表示,Operator在视频中所展示的内容,GLM-PC也完全可以做到。


二者的相同之处在于, 输入的模态(图像感知)、输出的操作空间(点击、滚动、输入)一致,并且都做了敏感性检测,让用户在敏感时刻(例如确认提交等)接盘操作,以及都有推理和一定程度的自反馈。不同之处在于,Operator现阶段主要针对网页,而GLM-PC针对电脑的任何操作(也包括浏览器)。


编辑 王进雨

校对 柳宝庆


来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
北京已有132款大模型通过备案上线,占全国总量近35%
北京
快手上线AI单元剧,AIGC内容如何商业化落地
科技
陶 然:通过改革稳房价,可控缓慢下降是最好结果——深度解读房地产未来
新京号
MWC上海观察:5G-A+AI加速应用落地,驱动增长模式转变
科技
AI填志愿靠谱吗?这10款热门产品存在“硬伤”
新京号
实测近十款AI高考志愿填报产品:存在定位偏差、信息失实等硬伤
教育
中国高等教育 | 龚旗煌:从理念到实践:人工智能赋能下的高等教育创新探索
新京号
AQ对医院意义或不输DeepSeek
智库
AI浪潮录丨王晟:谋求窗口期,AI初创公司不要跟巨头抢地盘
科技
智源发布“悟界”系列大模型 重塑AI交互边界
科技

新京报报料邮箱:67106710@bjnews.com.cn