百度创始人、董事长李彦宏在12日召开的百度世界2024大会上预计,智能体是AI应用最主流形态,即将迎来爆发点。
记者 温婷 摄
“我们即将迎来AI应用的群星闪耀时刻。”李彦宏表示,在AI原生时代,智能体是内容、信息和服务的新载体。李彦宏还透露,目前文心大模型日均调用量已经超过15亿。
在开场演讲中,李彦宏表示,大模型火了将近两年,相关技术以前所未有的速度进行迭代和创新,从大公司,到创业者,再到风险投资,各路人马都在寻找生成式AI时代基于大模型的超级应用。
回顾过去两年大模型的发展进程,幻觉问题被认为是大模型广泛应用的最大限制之一,而解决文本生成幻觉问题背后的技术就是RAG,即检索增强。李彦宏认为,检索增强生成(RAG)从百度特色逐渐发展成为了行业共识。目前,文字层面的RAG已经做得很好,基本让大模型消除了幻觉;但在图像等多模态方面,和RAG的结合还不够,这也是百度希望重点突破的方向。
目前,基于大语言模型的文生图还有比较严重的幻觉,尤其是针对长城、东方明珠、金字塔、爱因斯坦、贝多芬等特定地点、物品和人物,常常会出现张冠李戴的幻觉问题,让生成的图片“一眼假”,极大地影响了AI的实用性。
针对上述问题,百度开发了检索增强的文生图技术iRAG(image based RAG),将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片。“整体效果远远超过文生图原生系统,去除了机器味儿。”李彦宏说。
李彦宏现场展示了一幅由文心大模型生成的大众揽巡汽车飞跃长城的图片。通过文心iRAG技术,无论是这款特定型号汽车的车型车标,还是作为背景的长城,均未出现错误或变形的幻觉问题。
据介绍,iRAG技术极大地提高了AI生成图片的可用性。在影视作品、漫画作品、连续画本、海报制作等应用场景中,iRAG都可以大幅降低创作成本。
消除大模型的幻觉,也是AI应用爆发的基础。在李彦宏看来,今天,基础大模型能力就绪,即将迎来AI应用的群星闪耀时刻。
截至11月初,百度文心大模型的日均调用量超15亿,相较5月披露的2亿,增长7.5倍;相较一年前首次披露的5000万次,更是增长约30倍。李彦宏表示“这个增速超出预期”,说明AI是真需求。他感慨,这条陡峭的增长曲线,代表着过去两年中国大模型应用的爆发。
记者 温婷 摄
“今天,全球所有顶尖科技公司都在关注智能体,但像百度这样把智能体作为最重要战略方向的公司并不多。”李彦宏表示,就像PC时代的网站、移动时代的自媒体账号,在AI原生时代,智能体将成为内容、服务和信息的新载体。
“智能体是AI应用的最主流形态,即将迎来它的爆发点。”在李彦宏看来,智能体的门槛低、天花板高,既能让人人都上手,又能做出复杂强大的应用。当天,他展示了文心智能体平台的TOP100智能体,既有角色类智能体,也有工具、行业、职场、情感、娱乐等各类场景的智能体。目前,文心智能体平台已吸引了15万家企业和80万名开发者。
李彦宏表示:“百度不是要推出一个‘超级应用’,是要帮助更多人、更多企业打造出数百万‘超级有用’的应用。”
百度现场还展示了无代码工具“秒哒”,具备无代码编程、多智能体协作和多工具调用三大特性,用自然语言就能搭建一整套系统,将开启一个“只靠想法就能赚钱的时代”。
记者 温婷 摄
“我想,AI之所以被称为产业革命级的机会,就是因为它对于社会经济,带来了生产力的无限扩张。秒哒让每一个人都能具备程序员的能力,会说话就能做出应用来,它对于人类工作效率的提升怎么说都不为过。”李彦宏说。
据透露,秒哒将于明年一季度正式发布。
记者 温婷 摄
作者: 温婷