ITBear旗下自媒体矩阵:

2025年,中国版Reddit花落谁家?AI时代语料争夺战打响

   时间:2025-01-15 20:57:20 来源:钛媒体APP作者:ITBEAR编辑:快讯团队 发表评论无障碍通道

Reddit在2024年大放异彩,这家历史悠久的社交平台不仅在3月份成功登陆纽交所,还在上市后的第三季度实现了首次盈利。其股价更是飙升,目前已达到上市首日开盘价的350%左右。这一连串的成功背后,有一个不可忽视的关键因素——人工智能(AI)。

随后,在上市后的5月,Reddit又与OpenAI建立了类似的合作关系。根据协议,Reddit的问答内容将被整合到OpenAI的产品中,同时,Reddit平台的编辑功能和附加模组也将引入由OpenAI技术驱动的AI功能。这一双向合作不仅为Reddit提供了技术支持,还为OpenAI提供了宝贵的语料资源。

在众多UGC(用户生成内容)社交平台中,为何Reddit能够成为AI大模型厂商青睐的语料供应商?这主要得益于其独特的业务生态、内容模式和发展阶段。

业务生态上,Reddit作为一个相对独立的平台,其背后由多个利益集团及个人控股,没有像国内一些社交平台那样拥有丰富的产品生态和产业链。因此,Reddit无需顾及自身的生态组合,可以更加灵活地与其他公司进行合作,将语料作为筹码进行交易。

内容模式上,Reddit通过subReddit(子论坛)来组织内容,用户可以创建和加入不同的子论坛,发帖和评论。这种机制使得Reddit能够形成较好的语料产出正向循环,用户可以对帖子和评论进行“点赞”或“点踩”,被点赞的内容会获得更多的曝光机会,而被点踩的内容则可能被隐藏。这种机制与知乎、豆瓣等平台类似,但Reddit在语料的质量和多样性上更具优势。

发展阶段上,Reddit在创立近20年后才开始盈利,收入结构相对单一,主要依赖平台广告。然而,在AI大模型时代到来之际,Reddit迎来了业务拓展和盈利的最佳时机。通过提供语料资源,Reddit不仅能够增加收入,还能与AI大厂建立紧密的合作关系,共同推动AI技术的发展。

那么,在国内众多具有较多文字语料且业务较为独立的UGC平台中,谁最有可能成为AI时代的中国Reddit呢?我们可以从B站、小红书、微博、豆瓣、知乎和贴吧等平台中进行比较和分析。

然而,并不是所有UGC社交平台都能出售语料。像微信生态内的公众号和小绿书等内容渠道,由于其母公司拥有丰富的产品生态和产业链,不太可能将平台内容出售给其他AI厂商。同样的情况也适用于抖音的母公司字节跳动,他们更倾向于将自身平台内容用于自身的AI模型训练。

相比之下,B站、小红书、微博、豆瓣、知乎和贴吧等相对独立的C端社交平台产品,尤其是以文字类内容为主的平台,更有可能在AI时代像Reddit一样焕发新生。这些平台需要解决的关键问题是如何判定谁的语料更好更适合AI厂商的需求。

平台上用户自发的内容判定机制会成为首要因素。以Reddit为例,用户可以通过“点赞”或“点踩”对帖子和评论进行评判,这形成了较好的语料产出正向循环。同样地,AI厂商也会根据用户对生成内容的反馈来进行数据标注工作。平台自身的内容判定机制和用户画像与AI的适配度也是重要的考量因素。

在B站、小红书、微博这三个平台中,小红书可能最不想出售自己的语料资源。这是因为小红书目前正处于商业化探索的上升期,内容和交易双维度数据都显示出其生态的增长潜力。同时,小红书自己也正在测试多个AI功能,希望成为AI时代的甲方而非语料供应商。

相比之下,B站和微博则更适合与AI大厂达成Reddit模式的合作。B站已经与kimi等AI厂商有了较为深度的合作,内容储备量及质量较高,同时具有粘性较高的社区氛围和优质内容产出循环。然而,将平台内容用于AI训练之前,B站需要解决用户协议的问题,确保用户接受自己的评论、视频和文字等内容被用于AI训练。

微博则与B站不同,其用户对于自己的内容被用来生成AI内容似乎并不排斥。微博的评论机器人“罗伯特”就是一个很好的例子,它已经成为提升微博用户粘性的手段之一。微博的用户定位和使用场景都足够清晰,在高强度的注意力竞争中保持了相对稳定的用户规模。

因此,如果缺乏语料库的大模型厂商需要找到一个活人多的社交平台作为语料供应商,微博可能会是一个不错的选项。微博用户对于AI的高接受程度以及平台在内容判定机制上的优势,使其成为AI厂商理想的合作伙伴。

当然,除了微博之外,还有其他社交平台也具备成为语料供应商的潜力。这些平台需要满足用户心智上的需求,即在用户心里达成“我想在你这里说真心话”同时“我不在乎我在你这里说的话被拿去喂AI”的平衡。只有满足这一条件的社交平台,才有可能在AI时代脱颖而出,成为像Reddit那样的语料供应商。

社交平台在出售语料时也需要做好平台和用户的内容协议工作。确保用户同意自己的内容被用于AI训练是第一步,也是最重要的一步。只有这样,才能确保合作的顺利进行和平台的长期发展。

在AI技术日新月异的今天,语料库的质量和多样性已经成为影响AI模型性能的关键因素之一。因此,对于社交平台来说,抓住AI时代的机遇,成为语料供应商不仅是一个增加收入的途径,更是推动AI技术发展的重要力量。

随着AI技术的不断发展,我们可以预见,在未来的AI训练中,语料比拼将成为重要的竞争焦点。谁能够拥有高质量的语料资源,谁就有可能在AI领域占据领先地位。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version