【ITBEAR科技资讯】5月14日消息,近日,OpenAI发布了新一代AI模型GPT-4o,该模型能实时进行音频、视觉和文本推理。对此,出门问问的创始人兼CEO李志飞在其个人号“飞哥说AI”上表达了自己的观点。他认为,GPT-4o的出现有望彻底改变人机交互方式,引领下一波的科技、应用和商业模式的革新。
据ITBEAR科技资讯了解,李志飞强调,自苹果于2011年推出Siri后,许多公司都试图打造万能的虚拟个人助理(VPA),但大多数产品的用户体验并未达到预期。然而,OpenAI的GPT-4o无疑将VPA推向了新的高度。他列举了GPT-4o的几大特点,包括端到端的模型设计,实现了所有问题的一站式解决;实时交互能力,达到了平均300多毫秒的人类级别反应速度;多模态交互方式,可以自由切换不同的交互模式,同时并未降低语言的理解和生成能力;提供了流畅自然的交互体验,避免了反人类的唤醒方式和答非所问的对话问题。
此外,李志飞还对GPT-4o的未来充满期待,他认为该模型不仅将渗透到生活的方方面面,还可以与各种智能硬件、智能家居和车载等场景结合,实现跨场景的联动。同时,他也提到了前沿科技的时机问题,强调实现愿景的路径和节奏同样重要。
与此同时,猎豹移动董事长兼CEO傅盛也对GPT-4o的发布进行了点评。他以幽默的方式表达了自己的观点,虽然对没有发布GPT 5.0或GPT 4.5有些失望,但他也看到了GPT-4o在结合图片、文字、声音等多种引擎上的优势。傅盛认为,OpenAI发布的一系列应用和语音助手都显示了应用在人工智能领域的重要性,同时也指出了单纯依赖提升大模型能力可能遇到的困难。他期待OpenAI能够推动行业的更好发展,并鼓励所有人都应该努力去探索人工智能应用的可能性。