横跨大西洋11小时:用Mac跑Llama 70 B

2026-05-03 06:25:27 · chineseheadlinenews.com · 来源: 新智元

一位中国开发者,在横跨大西洋的航程中,在飞机上用 MacBook 本地跑 Llama 70B,整整 11 小时没有网络,帖子瞬间在X上爆火!但是随后,越来越多网友发现,这故事不太对啊?

一位中国开发者,在横跨大西洋的 11 小时航程中,拒绝了 25 美元的机上网络,却在万米高空完成了一整套复杂的客户项目交付?

没有 Cloud API,没有 Anthropic,没有 OpenAI,甚至没有一格信号。

只有一台 MacBook Pro M4、一段自己写的编排脚本,以及Llama 70B这个本地AI模型,然后就把项目跑通了?

舷窗外是白云与蓝天,没有 WiFi;小桌板上是一台 MacBook,终端开着两个窗口,本地运行着一个推理服务器

因为太过炸裂,这个帖子一经发出,就在技术社区传开了。

本地推理的时代,真的来了?

在万米高空,用MacBook跑Llama 70B

据说,故事的主角是一位中国开发者。

在飞往大洋彼岸的靠窗座位上,他打开64GB内存的MacBook Pro,面对的是堆积如山的客户任务队列。

接下来整整11个小时,都没有网络。

换做普通人,此刻已经乖乖掏出信用卡,支付那昂贵且延迟极高的 25 美元机上 Wi-Fi。

但他选择了另一条路:本地推理。

他启动了通过 llama.cpp 运行的 Llama 3.3 70B。

生成速度 71 tokens/秒,上下文约 60,000 tokens,内存占用 48.6 GiB / 64 GiB,起飞时电池剩余 3 小时 21 分钟。

为了让这个庞然大物在64GB内存的机器上跑起来,他甚至为自己编写了一个“离线编排器”脚本。

最令人拍案叫绝的,是他给AI下达的系统提示词。

你是一个运行在单台 MacBook 上的离线编排器。没有网络。你唯一的资源是 /Users/dev/work 下的本地文件、localhost:8080 的 Llama 70B 推理服务,以及 3 小时 21 分钟的电池预算。

处理 /Users/dev/work/queue.jsonl 中的任务队列(每行一个客户任务)。对每个任务:起草 → 运行本地评估 → 保存产物到 /Users/dev/work/done/。每 12 个任务保存一次上下文检查点,以便更换电池后恢复。仅在队列为空或电池低于 5% 时停止。

因此,这个系统完全清楚自己所处的困境。

它知道自己未来 11 小时与世隔绝,知道内存和电池是有限的奢侈品,甚至知道在飞机降落前,它必须独自处理所有的逻辑。

系统在一个循环中运行:从任务队列中取出一个任务,进行推理处理,保存生成结果,写入检查点。一个接一个,就这样持续执行。

只有当电量低于 5% 时,调度器才会自动暂停,等待笔记本切换到备用移动电源,然后从上一次的检查点继续运行。

飞行过程中,系统日志里写下了这样的内容:

“已保存上下文检查点 8 / 12(pos_min = 488,pos_max = 50118,大小 = 62.813 MiB)”

“已恢复上下文检查点(pos_min = 488,pos_max = 50118)”

“提示处理进度:n_tokens = 50 / 60,818”

“任务 37016 完成 | 处理速度 = 71 tokens/s → 输出至 /Users/dev/work/done/proposal_westside.md”

有人惊呼:这是我过去一年里见过的最干净利落的离线 AI 工作流程!

11 小时航程,WiFi 花费为 0,当飞机轮子触碰跑道的那一刻,他合上电脑,所有的客户提案已经整整齐齐地躺在 done/ 文件夹里。

系统不再是一个只会复读的复读机,而是一个具备资源意识的管理者。

这正是“Self-aware Computing”最迷人的地方。

网友打假:

技术神话,还是“赛博爽文”?

不过,文章在社区疯传后,很快引来了技术极客们的质疑。

资深开发者们纷纷掏出计算器,开始疯狂“对线”。

第一刀:内存与权重的“不可能三角”

Llama 3.3 70B 如果以 BF16(半精度)运行,光模型权重就需要约 140GB 内存。要在 64GB 的 MacBook 上跑起来,简直就像把大象塞进冰箱。

64GB 内存大概率只能跑 4-bit 量化版本,算上 60k 的上下文 KV Cache,内存占用至少也要 40GB+,BF16 绝无可能。

非要说的话,要在64GB上跑70B,只有一条路——量化。4-bit量化后模型约35GB,加上KV缓存和系统开销,勉强能塞进去。

但量化版本和BF16是两回事,精度、推理质量都会打折扣。

帖子里写的是“bf16”。看起来,这个细节要么是不懂,要么是故意的。

第二刀:71 tokens/s 的“神仙速度”

帖子声称生成速度71 tokens/s。

根据 M4 芯片的实际表现,本地运行 70B 规模的模型,生成速度通常在 5-12 tokens/s 之间。

71 tokens/s 是什么概念?这几乎是顶级 H100 集群的响应速度。

“这个速度可能是 8B 模型或者是某种极致的投机采样,70B 跑出这个速度,MacBook 怕是要起火。”

评论区一位用户直接亮出自己的实测数据:M5 Max 128GB(注意,128GB,是帖子里设备内存的两倍),跑同款模型量化版llama.cpp,实测12.8 tokens/s。

更高端的硬件,跑更轻的量化版本,速度反而只有帖子声称的五分之一,因此,原帖中说的速度几乎不可能实现。

第三刀:11小时续航

帖子中提到的“更换电池”引发了老用户的集体怀旧:现代 MacBook Pro 都是一体化设计,所谓的“换电池”,大概率是切换到了大功率的备用充电宝(如百瓦快充移动电源)。

MacBook Pro M4 Max官方标称续航约18小时,那是轻度使用。持续满载跑70B推理,GPU和内存全程拉满,实际续航会大幅缩水。

虽然帖子里提到“切换到备用充电宝后恢复”——但跨大西洋航班经济舱的USB口功率通常只有7.5W到18W,而M4 Max满载功耗超过40W。

因此,续航11小时这个说法几乎站不住脚。

故事是假的,但范式转向是真的

面对质疑,我们需要剥开数据的水份,看清这件事背后真正令科技圈高潮的原因。

长期以来,我们已经习惯了“云端成瘾”。

没有 GPT-4 的 API,很多开发者甚至不知道该如何写代码;没有网络,AI 就变成了一个哑巴。

现在,本地推理,确实在发生一场静悄悄的革命。

2024年,在笔记本上跑7B模型还需要各种技巧。

2026年,M4 Mac上跑70B量化版已经是日常操作。虽然速度不快,大概10来个tokens/s,但已经能用。

真实的使用场景不是“飞机上交付完整项目”这种听起来很爽的叙事,而是一些更朴素的东西,比如离线环境下的文档问答,隐私敏感场景下不想把数据传上云等等。

这些场景不性感,但实用。

现在,llama.cpp的mlx后端已经针对Apple Silicon做了深度优化,Ollama也把部署门槛压到了一条命令。

即便 71 tokens/s 的速度存疑,BF16 的精度可能有夸张,但这种“在孤岛上建立文明”的技术浪漫主义,才是最牛的。

未来,最顶尖的开发者或许不再是那个最会调优云端 Prompt 的人,而是那个能在资源枯竭、完全离线的极端环境下,手搓出一个“自感知、自循环”AI 系统的人。

下一次坐飞机,你准备好带上你的“数字大脑”了吗?


    24小时新闻排行榜更多>>
  1. 伊朗战事“回旋镖” 美国精神航空受油价冲击停运
  2. 入住民宿,仔细检查空调出风口
  3. 川习会倒数 美军C17运输机降落北京首都机场
  4. "牛坚强“被困深山20天,饿瘦200斤
  5. 长寿男人的特征:“一小”、“一慢”、“一厚”
  6. 击毙本拉登15周年 海豹六队成员忆绝密行动
  7. 不想结节病变,这几种蛋少吃
  8. 五角大楼“内斗” 昔日“越南难民”今成美国海军掌门人
  9. 打不赢伊朗,就拿台当局开刀?
  10. 全球最合适步行的20城市 首尔居首 台北上榜
  11. 最新白宫晚宴枪击画面 枪手冲进会场 11特勤0命中
  12. 美国解密东航空难 中共为何隐瞒多年秘而不宣
  13. 亲历乘客讲述东航飞机撞廊桥:收到了300元补偿
  14. 中国出口:从消费品到“工业母机”
  15. 建国250年之际 净移民负增长 美国人正在逃离美国
  16. 穆杰塔巴下令抓人,川普急了要开火
  17. 行踪曝光!超级油轮疑"成功突围"通过荷莫兹海峡
  18. 东航一飞机落地上海机场撞上廊桥 乘客:撞三四次
  19. 美制裁五中企 中国商务部发禁令:不得承认执行遵守
  20. 文坛大家余华自嘲“翻车”:辅导儿子语文 考不及格
  21. 哈佛汉学家宇文所安去世 他的妻子是天津著名才女
  22. 最严酷的地方之一:1960年代试图重塑绿色"乌托邦"
  23. 是谁杀死了那10场音乐节?
  24. 纽约将迎“最热夏天”
  25. 中国新能源车,进入“9系”时代
  26. 美国防长夫人也穿“中国货”?MAGA阵营破防了
  27. 川普警告伊"行为不当"将动武!批停战方案无法接受
  28. 从哈佛到中国高校,一场跨越半世纪的"文科裁员潮"
  29. “借米不借柴借衣不借鞋”为何柴和鞋不能借?
  30. 一批年轻女性,正在“崩老头”
  31. 从人脸识别到人口失踪:一场令人不寒而栗的反差
  32. 邵飘萍:你开枪吧
  33. 全面制裁 川普称美军将从伊朗返回路上接管古巴
  34. 考核全部不达标 马斯克1583亿天价年薪一分没拿
  35. 疑似爱泼斯坦“绝笔”流出
  36. 若想肝脏健康,4种甜食别常吃
  37. 【经典名句】但愿人长久 千里共婵娟
  38. 大陆医美内卷 童颜针价格从两万跌至999元
  39. 美最高法院判决后 共和党或靠重划选区拿下262席
  40. 中东运油受阻!日本"改向俄买油"荷莫兹封锁后首次
  41. 两位女性学者,“潜伏”饭圈1800天
  42. 美国对伊朗用兵:五大失误
  43. 习携九政治局委员到上海另立中央?三人或处境不妙
  44. 赖清德搭国王私人飞机赴斯威士兰 被嘲偷渡式出访
  45. 伯克希尔最新成绩单公布
  46. 美国顶级“生物黑客”首曝作息清单
  47. 川普再获新绰号
  48. 装修家为啥说“穷看客厅 富看厨房”?
  49. 一场跨越半世纪的“文科裁员潮”
  50. 巴基斯坦斡旋美伊有好处 中国给潜艇 美帮升级战机
  51. 川普:计划从德国撤军 规模远超五千人
  52. 美防长牛皮吹太大挨轰
  53. 从德国撤军5000人,德国人真的能偷笑?
  54. 95岁巴菲特正式“退役”!接班人阿贝尔首秀
  55. 69岁考医学院,73岁开始住培,她图什么?
  56. 19岁女学生遭情杀弃尸,身中61刀
  57. 美菲军演在台湾附近部署反舰导弹 释何信号
  58. 赖清德上演“偷渡式”闹剧
  59. 美菲“肩并肩”军演 反舰导弹进驻距台160公里群岛
  60. CNN:美伊开打2个月"世界几乎全输",中俄是赢家