AI智能体又进化了!这家公司先OpenAI一步

科创板日报 2025-01-24 17:02

智谱、OpenAI上线AI智能体新产品,最大的独特之处在于具备独立思考、调用工具的能力。

作者 | 宋子乔

春节将至,年味儿渐浓,AI给出了拜年新思路,让AI智能体(AI Agent)送上春节祝福,一句话就能实现——

据自媒体测试,给AI下达“给群里所有人发送新春祝福语”的任务后,AI为该微信群的各位定制了不一样贺词,且“细心”附上了对方名字,无需手动操作便完成发送。

用GLM-PC发定制化新春祝贺时GLM-PC的思考过程

这番操作出自智谱刚上线的电脑智能体GLM-PC。

1月23日,智谱正式上线GLM-PC。据介绍,GLM-PC是基于智谱多模态大模型 CogAgent,全球首个面向公众、回车即用的电脑智能体(agent)。它能像人类一样“观察”和“操作”计算机,协助用户高效完成各类电脑任务。GLM-PC还推出了深度思考模式,并新增逻辑推理和代码生成功能。

2024年10月,智谱发布的手机版智能体AutoGLM火速出圈,跟手机端的AutoGLM不一样,GLM-PC引入了代码机制,而在深度思考模式下,GLM-PC接收任务后会生成一套非常详细的思维链,再去执行,代码式的思维链可进一步强化GLM-PC对复杂任务的规划、推理、和反思的能力。

目前,GLM-PC的Window和Mac客户端已同步上线。智谱表示,正与联想、华硕等知名PC 厂商展开深度合作探讨,共同推动AIPC的创新与发展。

晚些时候,OpenAI的AI智能体Operator在北京时间1月24日凌晨亮相,它能够代理用户执行基于网页的操作,直接与网页交互——像人类一样点击、滚动和输入文字,自动执行各种复杂操作,包括编写代码、预订餐厅、购物等。后续的部分用户测试显示,Operator还可以完成在Arxiv上进行论文分类搜索,阅读多篇论文并完成综述整理的复杂工作。

用Operator预定餐厅

用Operator买菜

与智谱的深度思考模式类似,Operator可通过新模型“计算机使用智能体”(Computer-Using Agent,简称CUA)的系统进行复杂的思维链反思和步骤规划,CUA结合了高级的图形用户界面感知能力与结构化的问题解决能力,能够将任务分解为多步骤计划,并在遇到挑战时自我调整和纠正,大大提高了Operator完成任务的精度和复杂性。

目前,OpenAI的“Operator”智能体以“研究预览”(research preview)的形式向美国的ChatGPT Pro用户开放。(小K注:ChatGPT Pro的订阅费用为每月200美元,该服务专为需要高级AI功能的专业用户设计,提供无限制访问包括GPT-4o和o1在内的高级模型)

OpenAI表示还将扩展智能体的动作空间,在接下来几周/几个月内推出更多的智能体。此外,其还计划开放API接口,让开发者能够基于CUA构建自定义的计算机智能体。

2025 智能体元年?

OpenAI总裁Greg Brockman为Operator打call并强调,“2025年是智能体之年”。

OpenAI曾被曝出内部AGI路线图,将这一终极目标的实现划分了五级。目前OpenAI正向AI智能体,即L3级迈进(代理者,可以采取行动的系统)。

2024年,智谱同样将AGI的实现划分了5级。智谱CEO张鹏在Agent Open Day上再次阐述了公司对AI能力演进的战略构想——截至目前,LLM已经初步具备了人类与现实物理世界互动的部分能力,智能体将会极大地提升L3使用工具能力,同时开启对L4自我学习能力的探索。

无论是智谱还是OpenAI,其智能体最大的独特之处在于具备独立思考、调用工具的能力。对于普通用户而言,其最核心的功能是AI自主操作硬件设备,辅助完成复杂推理任务。

手机上的智能体能够精准操控各类应用,实现跨场景智能交互;电脑端的智能体被训练用于与图形用户界面GUI(在屏幕上看到的按钮、菜单和文本框)进行交互,意味AI能适应几乎所有的计算机环境,进一步凸显了AI玩转各类操作系统的能力。

另据《科创板日报》不完全梳理,谷歌、微软、Anthropic在内的头部厂商正争先推出AI智能体产品——

微软在其Dynamics365平台一口气推出10个自主AI智能体,称相当于187名全职员工的产出;

谷歌发布号称“智能体时代”最强大模型Gemini 2,提供多模态开发接口,让智能体能“看懂”物理世界;

Anthropic为大模型Claude迭代了新功能——Computer Use,让AI可以像人一样操控电脑。Claude3.5 Sonnet是首个支持计算机控制的模型,能够模拟人类操作计算机,包括移动光标、点击按钮和输入文本;

华为公布了一项可让AI像人类一样操作手机的新研究成果,相关团队提出了一个手机控制架构:Lightweight Multi-modal App Control(轻量级多模态应用控制,简称LiMAC)。

华创证券表示,随着AI技术的不断进步,AI Agent已经不再局限于简单的任务执行,当前正逐步实现从0到1的跨越式创新。众多企业和研究机构投入研发,推出创新产品。行业结构初步形成,相关产业链和生态系统逐渐完善。根据Root analysis,预计全球AI代理市场规模将从2024年的52.9亿美元增长到2035年的2168亿美元,2024-2035年预测期内的复合年增长率为40.15%。

天风证券表示,展望2025年,AI Agent和推理需求的指数级增长有望引领规模化AI应用元年,持续推动软件产品能力边界的拓展,赋能企业实现更高效的运营和成本优化。以字节跳动为代表的企业通过豆包AI等核心产品的广泛应用,率先全面布局AI市场,显著提升推理能力和多场景适配性,为国内AI Agent技术实践提供了落地基础。结合大模型与AIAgent未来的技术进步,智能化应用场景加速拓展,助力企业级市场实现降本增效。这一现象将引领ToBSaaS行业迎来新一轮成长机遇,为中国软件行业在未来五年孕育出一批高成长型红利企业奠定基础

中国银河证券表示,AI Agent将是通往通用人工智能时代的必经之路,大模型快速迭代升级推动AI Agent能力提升,长期来看AI Agent关键在于推理能力,未来AI Agent广泛渗透时,对于推理算力的需求将是指数级爆发增长

科创板日报 国内首个专注科创板、创投及TMT等领域的新锐媒体,致力于打造领先、专业、权威的科创信息服务平台。
评论
  • 松下电器停产的消息对于电子工程领域的从业者,尤其是准备就业的大学生来说,直接是一个炸弹级别的消息。这一事件不仅反映了家电行业的变革,也对电子工程师的职业发展是不是直接转型人工智能?从松下电器的停产可以看出,传统家电业务正在面临前所未有的冲击。然而,这并不意味着电子工程师的未来发展方向就一定是人工智能。虽然人工智能是当前科技领域的热门话题,且在未来有着巨大的发展潜力,但电子工程师的就业方向仍然十分广阔。对于准备就业的大学生来说,应该根据自身兴趣、市场需求和自身能力,有针对性地规划职业发展。例如,嵌
    curton 2025-02-05 22:43 143浏览
  • 感谢平台提供的本次免费阅读机会,有感于俞先生分享其的行业阅历,深表感激。以下谨表自身的阅读感悟:        这本书凝聚着作者的智慧与经验,深入浅出地讲解了芯片的方方面面,有较高的阅读价值,让我对芯片设计公司的运营有了全新的认识。书中通过作者在硅谷的实际工作经验,深入剖析了芯片设计行业的核心要素和运营策略。通过该书让我了解到芯片设计不但是设计制造活动,更是一场商业与管理的融合。书中详细阐述了从市场调研、产品规划、设计研发到生产销售的完整流程,每一个环节
    lynchem 2025-02-06 16:41 175浏览
  • 文/Leon编辑/侯煜‍春节假期前,二线空调品牌奥克斯电气有限公司(以下简称奥克斯)正式向港交所提交招股说明书,拟主板挂牌上市,中金公司为独家保荐人。事实上,这并非奥克斯第一次接触资本市场。2015年12月,奥克斯曾获准在新三板挂牌,但上市一年后便于2017年1月摘牌;2016年,奥克斯又计划在上交所上市,聘请东方证券提供辅导,并于2023年6月完成上市辅导,但最终未能成功。奥克斯此次赴港IPO,旨在拓宽融资渠道,获得更多资金用于研发、制造等环节,并提升国际知名度及竞争力,以应对竞争激烈的空调市
    华尔街科技眼 2025-02-06 14:16 119浏览
  • 随着自动驾驶技术的快速发展,车辆准确感知周围环境的能力变得至关重要。BEV(Bird's-Eye-View,鸟瞰图)感知技术,以其独特的视角和强大的数据处理能力,正成为自动驾驶领域的一大研究热点。一、BEV感知技术概述BEV感知技术,是一种从鸟瞰图视角(俯视图)出发的环境感知方法。与传统的正视图相比,BEV视角具有尺度变化小、视角遮挡少的显著优势,有助于网络对目标特征的一致性表达。基于这样的优势,可以更有效的对车辆周围环境进行感知。图1:BEV 感知图因此,在自动驾驶感知任务中,BEV感知算法通
    康谋 2025-02-06 14:44 155浏览
  • 在现代电子设备的复杂电路体系中,晶振扮演着不可或缺的角色,堪称电子设备的 “心跳起搏器”,为各类电路提供稳定的时钟信号。了解晶振的技术指标,是把握其性能特点、实现精准应用的关键,下面将对晶振的核心技术指标进行深入剖析。一、频率精度频率精度是衡量晶振实际输出频率与标称频率接近程度的关键指标,通常以 ppm(百万分之一)为单位衡量。与陶振相比,晶振的频率精度具有显著优势,可轻松达到 ±1ppm 甚至更高精度,这使其在对频率精度要求极为严苛的领域大显身手。例如,在全球定位系统(GPS)中,卫星与地面接
    Jeffreyzhang123 2025-02-05 17:31 192浏览
  • 尊敬的客户:感谢您选择北汇信息!2024年是不平凡的一年,中国汽车产量再创新高,出海与内卷挑战不断。北汇信息作为汽车电子测试领域的服务商,秉承“价值创造、共享成功”的理念,一直致力于为国内外汽车客户提供优质的产品和服务,共同面对这些挑战带来的困难和机遇。作为东方中科的旗下公司,北汇信息于2024年全面导入了OBS。OBS是东方中科企业管理系统的简称,是以战略部署和日常管理驱动持续改善的企业运营方法和体系。OBS旨在实现卓越客户满意度,不断追求改进质量、交付、成本和效率,并支持创新和成长。虽然北汇
    北汇信息 2025-02-06 12:01 127浏览
  • 2025年2月5日最新消息,松下电器宣布其电视机业务将停止,这一消息对消费者、市场以及整个家电行业都产生了深远的影响。对于消费者而言,松下电视机的停产意味着他们失去了一个高品质的选择。松下作为家电行业的老牌巨头,其电视机产品一直以高品质和稳定性能著称,深受消费者喜爱。停产后,消费者可能需要转向其他品牌,这可能需要他们重新评估自己的购买决策,以适应新的市场格局。松下电视机业务的停产,背后有多重原因。一方面,随着中韩家电企业的快速崛起,市场竞争日益激烈。这些企业凭借灵活的市场策略、精准的产品定位和较
    curton 2025-02-05 19:42 324浏览
  • 故障现象 一辆2015款奔驰R320车,搭载276 826 发动机,累计行驶里程约为18万km。该车行驶中,组合仪表上的ABS警告灯、防侧滑警告灯、发动机故障灯等多个故障灯偶尔异常点亮(图1),且车速表不指示,挡位不显示,同时车辆加速不良;另外,发动机偶尔无法起动着机。 图1 故障时的组合仪表 故障诊断 用故障检测仪检测,发现多个控制单元中均存储有未曾接收到其他控制单元的CAN信息的故障代码;梳理这些故障代码,发现曾丢失通信的控制单元有转向柱控制单元(N80)、车身稳定系统控
    虹科Pico汽车示波器 2025-02-06 15:38 134浏览
  • 普遍观点认为,当温度较高且伴有一定的风速时,能更有效地促进头发的干燥。随着高速吹风筒的问世,凭借其高风速的特性,这类吹风筒迅速占据了市场的主导地位。现在让我们一同深入探索高速吹风筒的独特之处。▲(前)普通吹风筒原理图、(后)高速吹风筒原理图       传统的吹风筒,采用的是交流低速电机驱动的风速,其吹干头发的机制是:通过大电流加热内部发热元件,随后利用普通电机驱动的风扇叶片,吹出热风以蒸发头发上的水分,从而达到干燥的目的。    &n
    晶台光耦 2025-02-06 10:09 153浏览
  • 在过去的一年中,作为电子工程师,我深入参与了多个电子产品的研发与设计工作,通过不断学习和实践,我在专业技能和项目管理方面都有了显著提升。以下是我对过去一年工作的总结:一、专业技能提升  1. 深入学习了最新的电子技术趋势,包括高性能数字信号处理、嵌入式系统开发以及低功耗电路设计等,为项目研发提供了有力的技术支持。  2. 熟练掌握了多种电子设计软件的使用,如Altium Designer、Cadence等,提高了设计效率和准确性。  3. 在硬件调试和测试方面积累了
    向幸 2025-02-06 14:56 140浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦