作者 | 刘宝丹
编辑 | 黄昱
距离ChatGPT横空出世已有两年,AI大模型技术迎来了新的发展阶段,AI Agent成为行业竞争的新焦点,国内AI独角兽智谱也率先披露了Agent技术方面的布局。
11月29日,在智谱Agent OpenDay上,公司CEO张鹏发布了AutoGLM升级版。这一版本不仅能够执行超过50步的复杂操作流程,跨越不同应用程序执行任务,还能支持长任务的自定义短语,并具备主动决策的能力。
智谱AI还推出了基于PC的自主Agent——GLM-PC,它的定位是成为一个全面的桌面助手,目前涵盖会议替身、文档处理、网页搜索与总结等功能。
此次升级标志着,智谱AI在语言交互的基础上,进一步推动大模型技术向更复杂的物理世界交互迈进。
智谱创立于2019年,由清华大学计算机系知识工程实验室的技术成果转化而来,是“AI六小虎”中成立最早的AI创业公司。在ChatGPT走红的前两年,智谱AI便已全力投入大模型技术的研发,目前已经成为AI技术布局最为完备的公司之一。
AutoGLM能快速推出,也是得益于智谱的前瞻性技术布局,包括智谱在大语言模型、多模态模型、逻辑推理和工具使用等方面的技术积累。
张鹏表示,从2023年4月的Agent Bench开始,到2023年8月的CogAgent模型,智谱针对AutoGLM,和GLM-PC的模型CogAgent的研发工作进行了一年半的时间。
对智谱而言,AutoGLM和GLM-PC是公司迈向AI智能操作系统的重要一步,更是通向AGI的必由之路。
与 GenAI 不同,Agent 是目标驱动型的,能够完全执行工作流程,适应、学习、迭代、与其他系统和人类协作,并端到端的完成任务。张鹏认为,Agent可以视为大模型通用操作系统LLM-OS的雏形。
张鹏表示,“现阶段,AutoGLM 相当于在人与应用之间添加一个执行的调度层,很大程度上改变人机的交互形式。更重要的是,我们看到了 LLM-OS 的可能,基于大模型智能能力,未来有机会实现原生的人机交互。将人机交互范式带向新的阶段。”
业内普遍认为,2025 年将是 Agent 爆发之年。Gartner 近期将 agentic AI 列为 2025 年十大技术趋势之一,并预测 2028 年至少有 15% 的日常工作决策将由 agentic AI 自主完成,而这一数字在 2024 年为 0。
业界领袖如黄仁勋、李彦宏、奥特曼等都公开表示看好其未来发展。黄仁勋认为,AI Agents是人工智能发展的未来趋势,世界各地都在竞相采用人工智能来加速创新和提高生产力,很快,公司将有AI Agents和团队一起工作。
根据 marketsandmarkets 的数据显示,2019 年全球自主智能体市场份额为 3.45 亿美元,预计 2024 年将达到 29.92 亿美元,其间 CAGR 为 54%。该机构预测,2023年全球自主人工智能和自主智能体的市场规模在2028年能达到 285 亿美元,其间CAGR 为43%。
对智谱而言,提前布局AI Agent赢得了宝贵的时间优势,这对于一个处于快速技术迭代的行业来说至关重要。然而,AI Agent仍处于早期阶段,智谱AI面临的竞争压力不容小觑。
张鹏坦言,目前大模型的能力距离真正代替人们办公还有一定距离。未来,GLM团队将继续加速Agent模型产品的研发。
挑战也显而易见,全球巨头们都开始加注AI Agent。6月,苹果在开发者大会上展示了其最新的AI成果Apple Intelligence,Anthropic(Computer Use)、谷歌(Jarvis)和 OpenAI(Operator)等企业也已经将 Agent 作为 2025 年的主要关注点。
下半年以来,投资人对AI大模型行业的投资热情已经显著下降,AI创业公司普遍面临商业化方面的压力。对此,张鹏表示,商业化固然重要,但并非唯一目标,智谱AI希望在技术投入和商业化之间找到平衡。
张鹏强调:“我们看待问题更多的是技术导向,是最终目的的导向,而不是仅局限于单项技术的快速变现。我们最终是帮助大家切切实实解决生产力问题,而不仅仅是简单的快速盈利。”
根据IT桔子数据,智谱成立以来累计完成10轮融资,目前估值为260亿元,仅今年,公司就经历了4轮融资,背后的投资者既包括阿里、腾讯这样的大厂,也包括红杉、高瓴等资本机构,北京人工智能产业基金、清华控股、中关村科学城也是智谱的股东。
AutoGLM只是一个开始,在经过了5年多的技术沉淀后,智谱开始真正迈向大规模应用阶段,虽然离用一句话操作电脑和手机的范式还有很远距离,但探索之路已经开始了。