马斯克开源X最新推荐算法

2026-05-16 01:25:40 · chineseheadlinenews.com · 来源: 新智元

马斯克又搞大事!?把社交平台绝对不会公开的两样东西“广告”和“审查”,连同一个能直接跑的推荐模型,一口气全推上了GitHub。6亿人每天刷到什么,现在是Grok说了算。

就在刚刚,马斯克把?最新版的算法给开源了!

老马的官宣只有一句话,但瞬间就引来了超2700万网友的围观。

之所以这么炸,是因为社交平台有两样东西是绝不能给外人看的:

第一,广告注入系统,也就是“印钞机”。

第二,内容审查管线,也就是“生死簿”。

而?把这两样的源码,连同一个3GB大小的推荐模型,一口气全放到了GitHub上!

不是,?连广告代码都给了?

1月19日,?第一次把推荐算法开源。

当时公开的是Phoenix排名模型和Thunder信息流引擎,也就是是“你打开For You看到什么”的决策逻辑。

但广告系统的代码,一个字都没有。

这回,全给了。

新增的home-mixer/ads/目录里,有四个相关的Rust文件。

partition_organic_blender.rs,负责把广告和自然内容混在一起

safe_gap_blender.rs,负责控制两条广告之间至少隔几条自然帖子

ads_brand_safety_hydrator.rs + ads_brand_safety_vf_hydrator.rs,负责管品牌安全,确保广告不会出现在暴力或色情内容旁边

注意这里的关键词,blender,混合器。

也就是说,广告不是硬插的,是跟你发的帖子、你关注的人发的帖子一起排队、一起打分、然后按规则混合的。

你刷到的每一条广告,都是“赢”了旁边那几条自然内容才出现在那个位置的。

有个审帖工具,名字叫“deluxe”

另一个从未公开过的组件是grox/目录。

它专管帖子发出之后、进入推荐之前的那道“审查流水线”。

六个分类器各管一摊:

spam.py,负责垃圾内容检测

post_safety_screen_deluxe.py,负责安全审查(“豪华版”这个命名,很?)

safety_ptos.py,负责平台服务条款策略检查

banger_initial_screen.py,负责爆款初筛,判断一条帖子是否“够炸”

reply_ranking.py,负责回复排序

classifier.py,负责通用内容分类

这里最有意思的是banger_initial_screen。banger,爆款。

也就是说,?的算法里专门有一个分类器在判断“这条帖子炸不炸”,炸的优先往前排。

整套Grox管线用Python写成,跟Rust写的推荐系统主体形成了分层。

其中,Rust跑毫秒级排序,Python管“这条内容该不该存在”。

配套的还有Kafka数据加载器、ASR语音识别处理、帖子摘要生成器,以及一个调度引擎把这些任务编排成不同的“plan”跑起来。

3GB模型给你,拿去直接跑

技术圈最兴奋的可能是第三个变化。

以前开源推荐算法,你看得到逻辑但跑不起来。没有模型权重,代码就是一堆空壳。

这回?直接塞了一个预训练好的mini Phoenix模型:

Mini Phoenix Model

├── 嵌入维度: 256

├── 注意力头: 4

├── Transformer层数: 2

├── 模型体积: ~3 GB(Git LFS分发)

└── 推理入口: python run_pipeline.py(检索→排序,一行跑通)

一行命令,从检索到排序的完整推理流程就能跑通,pipeline结构跟生产环境一模一样。

当然,mini模型的参数规模远小于线上那个。

但这已经是社交平台历史上,第一次有人把“能跑的模型”和“生产级代码”打包在一起给出来。

一条帖子的生死,15个概率说了算

广告、审查、模型是这次最炸的三个新组件。但它们各自填进了推荐pipeline的具体位置。

1月那一版,pipeline六步里大部分只有骨架代码。

这次补全之后,每一步都有了完整的Rust或Python实现。

从2个候选源到7个以上,从0个用户画像hydrator到17个。

直接把整条pipeline从“能看”变成了“能跑”。

整条pipeline的灵魂在第5步打分。

Phoenix的Grok Transformer给每条帖子打分时,会同时预测15种用户行为的概率。

打分机制里还有一个设计叫Candidate Isolation,候选棒离。

Transformer推理的时候,候选帖子之间互相“看不见”。

每条帖子只能看到用户的历史行为,看不到同一批里有什么其他帖子。

为什么要这么做?

因为如果候选帖子互相影响,同一条帖子跟50条候选一起送进去和跟500条一起送进去,得分会不一样。

而?通过注意力掩码把这个依赖彻底切断,每条帖子的分数独立、稳定、可缓存。

换句话说,这15种预测,不是在猜“这个人喜欢什么”,是在判断你会做什么、不会做什么、以及做完之后会不会后悔。

你的For You,现在是一本打开的书

如今,全球主流社交平台里,?是唯一一个把推荐算法、广告系统和内容审查管线都摊在GitHub上的。

你的For You怎么排序,广告怎么混进来,哪些内容会被干掉,现在都有一份Rust和Python写成的答案。

而且这套推荐系统已经100%切换到Grok Transformer驱动,手工规则全砍。

也就是说,xAI的模型能力已经从聊天机器人,渗透到了6亿人每天的信息消费决策里。

推荐系统,可能是当下最有实权的AI应用场景。谁控制了排序,谁就控制了注意力。

有兴趣的可以git clone下来跑一把。

3GB模型,一行命令,你就能看到那15个概率是怎么决定你每天刷到什么的。


    24小时新闻排行榜更多>>
  1. 黑色星期五,全球股债双杀
  2. 川习会:美国盯着3B,中国盯着3T,谁占了上风?
  3. 中国大富之家,合影扒出狗血豪门宅斗
  4. 川习会场边蔡奇疑训斥王毅 中共权力格局惹议
  5. 川习会期间 中美人员屡爆冲突 白宫记者团挨渴、被困
  6. 中国发改委主任会见波音公司总裁 中方回应订单
  7. 央视获世界杯转播权 持久谈判背后藏着什么?
  8. 王毅3800字概述川习会晤 证实习近平9月将访美
  9. 官媒视角的川习会全记录:人民大会堂 天坛 中南海
  10. 美媒:台湾是最大输家 中美不翻桌也是双方共识
  11. 川普团队返美前 中国物品全被扔进垃圾桶
  12. 马斯克带儿子亮相北京 广西“虎头包”爆红卖断货
  13. 习再次变“高”?川普沙发疑似被动手脚 毛宁尬笑
  14. 外食太贵,好市多平价即食餐受欢迎
  15. 从接机到私人交流,川普访华的三个礼宾细节
  16. 王毅介绍中美元首会晤情况和共识
  17. 美食品价格现4年来最大涨幅 番茄涨39% 牛肉14.8%…
  18. 川普将拍板,140亿军售
  19. 五角大楼取消美军装甲旅部署波兰
  20. 川普松口:可接受伊朗暂停核计划20年
  21. AI正在泄露真实的个人电话号码
  22. 川普访华表态:应给中国留学生发绿卡
  23. 川普揽订单,承诺高出预期
  24. 川普踏入中南海“狂夸玫瑰花” 习爽快“送种子”给他
  25. 趁习近平离席“川普国宴间谍行动”曝光 影片掀热议
  26. 习近平称美国可能正走下坡 川普发文归咎拜登政府
  27. 万斯宣布暂扣加州白卡补助
  28. 下一代短波红外LED发光材料
  29. 卢比奥回应空军一号穿搭热议:马杜罗抄袭我
  30. 习私下对话曝光,川普语带惊讶
  31. 中美是否就稀土供应达成了新共识?
  32. 全球通胀加剧债市风暴,动摇AI牛市
  33. 川普公布“美国英雄国家花园”选址
  34. 结束访华返美途中 川普和高市早苗通话
  35. 湖北关注摘取器官的博主 直播时遭警察抢手机失联
  36. 高传染病毒B19蔓延加州 危害儿童孕妇
  37. 俄罗斯Q1 GDP下降0.2%
  38. 大陆女子求职被告知:拒潜规则就不录用
  39. 现实世界的特异功能侦探
  40. 马斯克中文回覆“李老师”登微博热搜后话题迅速被封
  41. 野村警告:这次“日债风暴”不一样
  42. 离谱双标引热议!张雪叫板雷军退款底气十足
  43. 参议院枪声背后:菲律宾内斗升级
  44. 王爱琳案发 民运人士:中共代理人仍大有人在
  45. 川普访华团返美前大清理 中国物品禁上“空军一号”
  46. 川普返回白宫,再谈中国之行
  47. 习在川习会上提修昔底德陷阱 被指严重误判
  48. 这公司盘活德国工业十年家底
  49. 伊朗扣押一艘海上军火安保船 船东来自中国
  50. 莲花“出淤泥而不染” 究竟藏着多少天机
  51. 李连杰首谈甲亢令面容巨变
  52. 川普刚结束访华离京,高市早苗发文称与之通话
  53. SpaceX加快IPO进程:最快6月定价
  54. 多家陆媒报美批准向10家中企售H200 后又删文
  55. 川普扬言再炸伊
  56. 洛警方突袭仓库 缴价值近千万假奢侈品 抓两亚裔
  57. 从“达纳萨尔案”看国家利益豁免的新设标准
  58. 美国130多座城市被限制加房产税
  59. 日本百年寺庙揭密震撼300万人
  60. 以军空袭加沙:打死哈马斯军事领导人