在AI技术日新月异的今天,ChatGPT的问世无疑为整个行业点燃了一把熊熊烈火,已经过去了两年时间,大众对大语言模型的热情依旧不减。曾经只存在于科幻电影中的场景,如今已经触手可及,一条简单的指令便能生成流畅且自然的文本。
然而,随着大模型技术的不断发展,行业也逐渐进入了一个关键的转折点。新技术如何转化为切实可用的新产品,满足真实的市场需求,并形成新的商业生态,成为了摆在从业者面前的一道难题。正如移动支付、智能手机和LTE共同推动了移动互联网时代的繁荣,AI行业也在焦急地寻找着属于自己的PMF(产品市场契合点)。
在这片新技术的海洋中,大航海时代已经拉开序幕,每一个参与者都在期待着能够发现新大陆。这不仅关乎大模型能否摆脱烧钱的资本游戏标签,避免重蹈.com泡沫的覆辙,更关乎它能否成为黄仁勋口中的新工业革命的开端。
从当前的竞争格局来看,基座模型的竞争已经趋于稳定。OpenAI凭借其ChatGPT在市场上稳坐头把交椅,而Anthropic、DeepMind、Llama和Grok等也各有千秋。然而,今年的焦点并不在于谁家的模型参数更多、响应速度更快,而在于如何将大模型技术转化为实际可用的产品。
大语言模型的技术落地问题从一开始就困扰着从业者。哈佛商业评论的调查显示,生成式AI的应用种类多达100种,但大体上可以分为技术问题解决、内容生产及编辑、客户支持、学习和教育、艺术创作和调查研究等五大类。
在商业化方面,一些知名的投资公司如a16z也给出了他们心目中的优秀生成式AI产品名单,其中既有通用类的Perplexity、Claude和ChatGPT,也有更为垂直的Granola、Wispr Flow、Every Inc.、Cubby等笔记类产品,以及教育领域的NotebookLM和聊天机器人Character.ai、Replika等。
对于普通用户而言,这些产品大多免费即可使用,订阅版或专业版的费用并非必需。尽管ChatGPT的订阅收入已经增长到每月2.83亿美元,但与巨大的成本相比仍显得微不足道。享受科技发展的红利是用户的乐事,但从业者却面临着更为严峻的挑战:如何将激动人心的技术进化转化为商业社会的实际效益。
相比之下,toB业务的发展前景更为明朗。自2018年以来,财富500强财报电话会议中提及AI的次数几乎翻了一番,生成式人工智能已成为最热门的主题之一。根据中国信通院发布的《人工智能发展报告(2024年)》蓝皮书预测,到2026年,超过80%的企业将使用生成式人工智能API或部署生成式应用。
在面向企业侧和消费侧的应用中,两者展现出不同的发展态势。消费侧的应用更注重低门槛和创意性,而企业侧则更注重专业定制和效益反馈。大模型需要在实际场景中证明自己的价值,才能真正赢得企业的青睐。
在国内,大模型的竞争同样激烈。根据工信部数据,2023年中国大语言模型市场规模增长率突破100%,达到147亿元。各家厂商在商业化进程上积极尝试,价格战成为首要手段。以tokens计费、API调用等方式的成本不断降低,许多主流热门通用类大模型的价格已接近免费。
然而,降低成本只是第一步,理解业务、分析切入场景才是更为崎岖的道路。腾讯云智能AI产品专家、腾讯混元ToB产品负责人赵新宇认为,在这种情况下,更重要的是找到自身的特点并发挥优势。腾讯内部拥有丰富的场景资源,这些场景为团队提供了更多洞察和打磨能力的机会。同时,团队也注重聚焦特定行业和场景,逐步拓展市场。
腾讯混元在技术实力上不容小觑。其发布的通用文生文模型混元Turbo采用全新的混合专家模型(MoE)结构,在语言理解、生成、逻辑推理、意图识别以及编码、长上下文和聚合任务中均表现出色。目前,腾讯混元的能力正在通过腾讯云全面输出,帮助模型应用落地到各种场景中。
在模型应用落地方面,大致可以分为严肃场景和娱乐场景两种。严肃场景主要指向企业核心业务运营中对准确性和可靠性要求较高的应用场景,如腾讯云帮助一家外呼服务商构建客服体系。在这个项目中,团队面临性能问题和对话逻辑准确程度两大挑战,通过密集迭代和快速响应,最终实现了95%的准确度,并为客户节省了四分之三的人力成本。
在与小米的合作中,混元团队展示了其在搜索场景中的优势。通过自建搜索引擎和意图分类模型,团队将问答互动按照不同话题层级逐步细化,并优化了时延和搜索内容整合问题。最终,无论是回答质量、响应速度还是性能等方面都完全满足了小米的需求,并成功上线到实际业务中。
toB业务的成功在于能够实现营收并赢得客户的信任,这需要实实在在地给客户的业务带来价值。通过服务不同企业场景,混元的迭代速度和泛化能力都得到了显著提升。这种能力不仅适用于严肃场景,还能拓展到偏娱乐向的场景中。
例如,在角色扮演内容平台“造梦次元”中,混元大模型的角色扮演专属模型Hunyuan-role得到了应用。该平台定位于服务年轻用户,提供交互式、剧情化的虚拟角色互动体验。Hunyuan-role在长短文本对话处理、意图识别和响应等方面展现出领先优势,能够胜任多样化的应用场景,并展现出出色的内容拟人化能力。
随着技术的成熟和成本的降低,大模型势必将向更广泛的应用场景扩展。从严肃的商业场景到娱乐、创意和内容生产等领域,大模型需要始终以解决具体场景中的需求点为核心目标,找到融合大模型能力的切入点。同时,与应用软件和硬件厂商的合作也将成为推动大模型技术落地的重要力量。