近期,科技界迎来了一场轰动性的事件——全球首款通用AI智能体Manus横空出世,迅速点燃了科技爱好者的讨论热情。这款AI智能体以其卓越的功能和广泛的应用前景,成为了科技圈内热议的焦点。
Manus的发布如同一石激起千层浪,引发了国内外众多初创公司和开源社区的积极响应。其中,国内DeepWisdom公司的metaGPT团队,在Manus发布后不久,便迅速利用开源框架复刻出了名为OpenManus的智能体。据metaGPT团队的核心成员向劲宇透露,从决定复刻到完成第一个版本,整个团队仅用了短短3个小时。同样,开源社区CAMEL-AI团队也迅速推出了Manus的开源替代方案OWL,并部分开源了相关模块。
这一系列复刻行动不仅展示了AI智能体技术的快速发展,也引发了业界对AI智能体门槛的重新评估。然而,面对如此众多的复刻版本,人们不禁要问:Manus的“护城河”到底有多深?AI智能体赛道的终极竞争力又是什么?
向劲宇在分享中表示,虽然复刻Manus的技术难度并不算高,但metaGPT团队在复刻过程中也遇到了不少挑战。他们通过构建一个极简的Agent框架,实现了可插拔的工具和提示词组合,从而快速复刻出了OpenManus。据他介绍,这个框架的关键在于提示词引导和工具使用,二者共同诠释了ReAct Agent的工作原理。
在谈到OpenManus的后续发展计划时,metaGPT团队的另一位核心成员梁新兵表示,他们将从增强规划能力、引入标准化评测、拓展模型适配以及实现容器化部署等方面入手,不断提升OpenManus的效果。同时,他也承认目前OpenManus的效果还很有限,尚未进行单独的效果调优。
尽管复刻版本层出不穷,但Manus的原始版本仍然以其卓越的用户体验和交互效果赢得了众多用户的青睐。据Manus官方网站介绍,这款AI智能体能够一键帮助用户完成旅行规划、股票分析、PPT制作、财报分析等多项任务,涵盖了研究、生活、数据分析、教育、生产效率等多个领域。在官方发布的视频中,Manus展现出了其强大的自主完成任务的能力,例如在特斯拉股票分析任务中,它能够在45秒内完成从数据抓取到建模再到报告生成的全链路操作。
然而,随着大模型能力的不断增强,一些市场人士开始担心Manus所创造的价值可能会被大模型的内生能力所淹没。他们认为,未来大模型或许能够独立实现Manus所期望达成的效果,而无需再繁琐地调用外部工具链。对此,AI领域的投资人士林亚秋表示,虽然大模型的能力在不断增强,但AI智能体的诞生仍然有其必要性。她指出,Manus能够最先跑出来,一方面得益于推理模型技术的重大进展,另一方面也离不开其创作团队强大的产品能力和对用户需求的深刻理解。
尽管Manus取得了显著的成果,但AI智能体赛道仍然面临着诸多待解难题。其中,大模型幻觉问题仍然困扰着AI的落地应用。在规划、记忆和工具调用等方面也存在一些技术难点有待解决。metaGPT团队认为,目前Agent在处理复杂、长程任务时,如何压缩上下文并存储到记忆中是一个具有挑战性的问题。同时,他们也指出了工具使用环节中的技术难点,如Agent在面临众多相似工具时如何做出准确决策等。
尽管存在诸多挑战,但业界对AI智能体的发展前景仍然充满信心。开源证券和华泰证券等机构纷纷指出,随着大模型性能的提升和成本的降低,AI智能体有望加快落地步伐,重塑各行业的工作流程。同时,Manus等AI智能体的诞生也激发了业界对AI技术的进一步探索和创新。
对于AI智能体赛道的终极竞争壁垒,metaGPT团队的洪思睿认为,Agent商业化的重要比拼在于将真实场景中的任务和效果做到极致。她指出,目前学术界的许多工作仍然面临着任务成功率有限的问题,如果这种相对微小的任务标准对应到真实的商业场景中,Agent的成功率还相当受限。因此,她认为只有针对各种各样的用户问题和场景做到极致,将成功率提升到令人满意的程度,才能真正实现Agent的商业价值。
随着AI技术的不断发展和创新,AI智能体有望成为未来科技领域的重要应用方向。然而,在追求技术创新的同时,我们也应关注其在实际应用中的效果和用户体验。只有不断优化技术、提升用户体验,才能推动AI智能体走向更加广阔的市场和应用领域。