ITBear旗下自媒体矩阵:

马斯克兑现承诺!X平台重磅开源推荐算法,6小时1.6k Star,引领行业透明新风

   时间:2026-01-21 12:51:26 来源:天脉网编辑:快讯 IP:北京 发表评论无障碍通道
 

近日,科技界迎来一则重磅消息:X平台掌舵者埃隆·马斯克宣布,将X平台最新的内容推荐算法开源。这一决定犹如一颗投入平静湖面的石子,在社交平台领域激起层层涟漪,引发了广泛关注与热议。

在社交平台竞争日益激烈的当下,推荐算法一直是各平台的“核心机密”。用户刷到的每一条动态、每一个广告,背后都是算法依据用户行为、内容标签、商业诉求等多维度数据计算得出的结果。此前,像Facebook、Instagram等社交平台,都将算法紧紧锁在“黑箱”之中,外界只能通过逆向工程来猜测其运行逻辑,平台也鲜少主动公开相关信息。然而,马斯克却反其道而行之,这一举措无疑打破了行业的常规。

马斯克之所以做出这样的决定,并非一时兴起。接手X平台前后,他就多次吐槽“算法不透明”的问题,立志要打造一个“自由广场”。此次开源算法,是他对X平台改造的关键一步。一方面,通过开源让全球开发者和用户能够监督算法逻辑,减少“算法偏见”“流量操纵”等方面的质疑,同时也能更好地应对监管;另一方面,借助社区的智慧来优化算法。毕竟,全球程序员的智慧远超内部团队“闭门造车”,这有助于巩固X平台的生态护城河。而且,马斯克还表示,后续将每四周更新一次代码,并附带开发者说明,标注算法和逻辑上的改动内容。这种“持续开源 + 透明更新”的模式,在社交平台领域堪称前所未有的尝试。

很快,X平台工程团队的Engineering官方账号给出了答案,正式宣布开源新的X推荐算法。该算法采用了与xAI的Grok模型相同的Transformer架构。与此同时,相关的GitHub仓库也一并公开,上线仅六小时就获得了1.6k个Star,足见其受关注程度之高。

打开GitHub仓库(https://github.com/xai-org/x-algorithm ),我们可以看到这次开源的是“For You(为你推荐)”信息流的核心推荐系统。据X工程团队介绍,“For You”信息流的内容主要来自两大方面。一是站内内容,由Thunder模块负责,即用户关注账号发布的帖子;二是站外内容,由Phoenix召回模块处理,也就是从全网内容库中筛选出的帖子。这两类内容整合后,会交给Phoenix模型进行分析。该模型基于Grok Transformer模型,Transformer实现移植自xAI开源的Grok - 1,并针对推荐系统的具体使用场景进行了适配和调整。它会通过用户的点赞、回复、转发等互动历史,预测用户对每篇帖子的各类互动概率,最终的内容得分是这些概率的加权组合。并且,该系统已剔除所有手工设计的特征及绝大部分启发式规则,核心计算工作完全由这款Grok Transformer模型承担,其核心逻辑就是通过分析用户互动历史,判断内容与用户的相关性。

从技术栈维度来看,这个仓库主要使用了Rust和Python两种编程语言,项目遵循Apache License 2.0开源许可。代码文件按功能模块划分,核心模块分工明确。phoenix/模块包含Grok模型适配、推荐系统模型、召回模型等核心代码,以及模型运行、测试脚本;home - mixer/模块以Rust语言开发,是推荐系统的“编排层”,包含候选内容补全、查询数据补全、打分器、过滤器等核心逻辑;thunder/模块基于Rust开发,负责处理“站内内容”的检索、反序列化、Kafka消息处理等;candidate - pipeline/模块则是候选内容流水线相关逻辑,是连接内容源与后续处理的关键环节。

该推荐系统有着清晰的工作原理和核心执行流程。从响应用户的信息流请求开始,算法会通过七个核心阶段完成内容筛选与推送。第一步是调取用户核心数据,系统会抓取用户近期的互动记录,如点赞、回复、转发、点击等行为,同时调取关注列表、账号偏好设置等基础元数据,为算法搭建“用户画像”的基础框架。第二步是抓取两类候选内容,基于用户数据,从站内和站外两大渠道检索候选内容。第三步是对所有候选内容进行信息补全,确保每一条候选内容的信息维度完整。第四步是在进入核心打分环节前,执行“前置过滤”,剔除不符合要求的内容,如重复帖子、过期内容、用户本人发布的帖子等。第五步是多维度打分并排序,过滤后的内容会依次调用四款打分器计算“适配得分”。第六步是筛选,算法按得分高低对所有内容排序,选取排名前K的候选内容进入最后环节。第七步是最终验证后推送,系统会对候选内容做最后一轮合规性、有效性校验,确认无误后才会正式推送到用户的信息流中。

在算法底层设计上,X平台的推荐系统有五大核心决策。它完全摒弃了手工设计的特征,核心依赖基于Grok的Transformer模型,从用户的互动行为序列中自主学习内容与用户的相关性,降低了数据处理流水线和推送基础设施的复杂度;在排序环节,模型对候选内容采取“隔离计算”方式,确保单篇帖子的得分不受同批次其他内容干扰;召回和排序两大核心环节均采用多个哈希函数实现嵌入向量的查找,提升了算法运行效率;该模型会同时预测用户对内容的多种行为概率,让打分维度更全面;系统基于candidate - pipeline框架搭建了可组合的流水线架构,具备高度的灵活性和可拓展性。

此次开源之际,马斯克直言:“我们知道这个算法很笨拙,需要大幅改进,但至少你可以实时、透明地看到我们努力改进它的过程。”他还强调,“其他社交媒体公司都没有这样做。”这一举措引发了诸多热议。对于普通开发者来说,此次开源的价值远超“看代码”本身。有网友评论称,当分配注意力的系统不透明时,丰富性是不可能出现的。将推荐算法开源,把注意力从一个神秘资源变成了一个可理解的系统,可理解性会改变人们的行为。虽然一开始透明度会让“玩法”更容易被利用,但这是一个阶段,开放系统会暴露漏洞、适应变化并不断改进。不过,也有用户担忧开源以后,现在更容易作弊,优质内容浏览量很快就会爆炸式增长。整体而言,如果X平台的“开源 + 透明更新”模式被证明有效,可能会倒逼其他平台做出改变,毕竟用户对算法透明的需求只会越来越高。

 
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version