李飞飞:我信仰的是人类,不是AI

2025-12-21 04:25:16 · chineseheadlinenews.com · 来源: 钛媒体

随着2025年渐入尾声,有着“AI教母“之称的斯坦福大学教授李飞飞,带着她创立的World labs迎来了一波又一波的新进展,包括首款商用“世界模型”Marble的发布,这开始让大家终于意识到,原来“世界模型”并非只是概念,而已经是真实有用的。

回想我第一次见李飞飞教授,已经可以追溯到2017年,在斯坦福大学教学楼内。那一年,刚刚定 居硅谷的陈天桥先生向我和其他几位老朋友介绍了李飞飞教授,他当时特别提到:这是美国最杰出的华人科学家之一。那时,李飞飞教授发起的ImageNet行动还在如火如荼的进行。我也第一次在与飞飞教授的见面和交流中学到了一个新的概念:为什么是数据集的大小决定了智能的程度。那也是她做 ImageNet的初衷,尽量拓宽数据池,以发展人工智能。虽然现在人工智能世界对数据集的处理量已经成万亿倍增长了,但当时,ImageNet创造了最大的数据集。重要的是,她领导的imageNet 运动在一片怀疑声中,向学界和业界都证明了,“数据”与算法一样,是人工智能发展过程中最重要的基石。

我们在后面的八年里见证了,ImageNet 如何成为了生成式 AI 发展历史里,一次里程碑式的行动。

更重要的是,八年过去了,李飞飞在人工智能世界里的努力依然没有停下来,她从通过领导ImageNet行动,推动了数据集和AI 1.0向 AI 2.0的一次大飞跃;到今天又了有了新的使命,那就 是领导“世界模型”,以突破LLM大语言模型构建世界的局限,但她也再次走到了世界模型”数据瓶颈的十字落口。

带着对她全新创业的好奇,我与李飞飞教授相约又进行了一次深度的视频播客对话,在这一期近两小时如轻松聊天的对话里,我们畅聊了很多话题,从青少年留学,到选择科学之路;从高校教授如 何成为美国三院院士,到硅谷创业;从AI发展历史不同阶段面对的不同问题,到不同阶段可能的解 决方案……一路走来,她也饱受质疑和谣言困扰,这一次在我的问题里,她也没有回避外界对她家 庭背景的种种猜测,让我看到了一个中国普通家庭长大的女孩,如何跨越重洋,在一个陌生的现实和学术世界里倔强生长的故事。

李飞飞也首次面对中文媒体,把“世界模型/空间智能”的技术脉络与她的价值观、方法论与创业判断,织成了一条连贯而清醒的叙事:世界不只是语言;AI的下一站,是让机器在连续的三维世界中“看见 —生成—互动”;而在所有宏大承诺之前,AI仍然只是工具,方向盘需要握在人类手里,这是人类始 终不能放弃的主动权,也是人类始终不能自我放弃的信仰。“AI只是工具。我信仰的是人类,不是AI”,她在我的播客直播里随意说出的这句话,在我心里却激起了久久不能平静的波澜。

这次对话也恰逢World Labs公布其最新的空间智能商用模型 Marble不久:从一张图片或文字提 示,生成“可持续存在、可自由导航、几何一致”的3D世界,并可导出为Gaussian Splat 等格式在网页与VR设备中体验与二次创作——这是从“内容生成”迈向“世界生成”的一次可感知的落地尝试。 官方博客与多家媒体的评述,突出其“更大、更清晰、更一致”的世界,以及面向创作者与开发者的可用工程链路(导出、Web/VR 渲染与交互)。

与此同时,“世界模型”正在成为产业竞逐的新高地:Google DeepMind 接连发布Genie 3、Gemini Robotics 1.5等路线,强调“生成可交互环境、具空间理解与规划能力”的模型方向;年初亦专门组建“世界建模”团队,面向游戏、影视与机器人训练。

一切进展都已经比一年前大家的预期要快了很多。李飞飞也在钛媒体这期“赵何娟Talk”里对话里 透露,从“语言生成”到“世界生成”,空间智能将在两年内迎来应用级爆发。

World Labs自2024年获巨额融资以来,始终以 “LWM(Large World Models,大型世界模型)” 为愿景推进,压力自然不小,她说她每天都很惶恐,惶恐自己模型不够好,惶恐辜负跟随她的年轻团队,惶恐辜负投资人,但“如果不彷徨了就说明你没有了挑战,说明这件事的意义也没有那么大。”“输就输了,没什么大不了的”、“大家总想什么很快就会发生,但通常不会那么快,耐心很重要” ……她的每一句话说的都很平静,却在AI世界无法平静的嘈杂和浮躁声浪里,如一股镇定的力量。

我自己也在硅谷走到了再次创业的起点,正在创立一家全新的尝试以原生AI为基础的App财经新闻产品。李飞飞鼓励说,“你在媒体上去探索新的AI产品形态的努力是对的,要让AI更好为人类服务”, 她在全世界质疑声中的坚持,同样给了我力量。

如何保持好奇和面对惶恐?

赵何娟:您的那本书《我看见的世界》,我印象非常深刻,我第一次看那本书的时候都哭了好几次,很打动人。我还让我女儿也看了,她也在留学嘛,就很能共情。第一个问题,就想问问您,有些什么给青少年怎么去观察世界的一些建议和视角吧?因为这个不仅是对留学生,对中国的这一代青少年成长也非常有帮助。

李飞飞: 谢谢你喜欢我的书,也谢谢你女儿也读了。其实说实话,我觉得现在的青少年真的,头脑就是真的很了不起。我自己不管从我的学生还是共同创业的同事,都很年轻,我有时候就觉得我跟他们学的比他们向我学的多多了。所以,我也不太好意思说我有什么要跟青少年讲的,那就可以共同地分享一下吧,我觉得还是像书名副标题的第一个词,我觉得好奇心,真的是一切的开始。尤其是,人之初这种好奇心,作为一个小孩子,毕竟那个时候世界还是很单纯,而且带着很多这个好奇来认识世界。

我自己写这本书时最大的感受,也是一种梳理吧,对我自己的科学之路是一种梳理,我觉得自己运气很好,就是不管是因为家庭的原因,还是因为我的求学之路,我这份好奇心被保护下来了。当然了,回过头去看,其实有很多人在呵护我的好奇心,对我来说是一份幸运。

然后我也希望把这份幸运和这种认知分享给青少年们。那就是,人生很多时候是从好奇心开始的, 不要丢掉这份好奇心,它真的可以让你烧起一把火,在你的心灵里边,对这个世界的好奇也好,对你梦想的追逐也好,这个火可以陪伴你很长时间,带你做很多很多的事情。

赵何娟:那怎么保持这样的一个好奇心呢?其实我对您在书里面提到的一些您观察这个世界,包括您观察周边人的一些视角,我都觉得很有意思。

李飞飞:我觉得可能还是有很多不同的因素吧。一个小孩子不可能去刻意地去保持甚至发掘好奇心,因为我觉得好奇心是与生俱来的。但是就像我说的一样,我自己觉得我很幸运,就是说,我自己可能基因里边带着强烈的好奇心,但是回过头看我走过的路,也有很多人呵护了我的好奇心。当我身边有那么多志同道合、保持好奇心的人的时候,也更容易自己也保持。所以,确实有很多因素。

很多人说,别人的成功之路不能复制,从某种程度上,是的,每一个人都很独特。但是呢,我也同时相信,有些东西是有共性的。就是,孩子的好奇心是有共性的,很多的父母,很多的老师,愿意去呵护孩子的好奇心,也是有共性的。

赵何娟:您很谦虚。但是可能这份幸运背后,就像您说的,有您自己,也有包括您身边的人,包括您的父母 老师,对您这份好奇心的保护。这个给我们成人也很有启发。对于我们成人来说,怎么去保护一个孩子的好奇心呢?我们能做些什么才不会破坏这份好奇?

李飞飞: 这个问题问得很好,何娟,因为你也是妈妈,我也是妈妈。我也当了那么多年的老师。其实好奇心的本质是什么?好奇心的本质代表一种快乐。它不是一个功利性的,它不是说因为我好奇了,我就会获取包多的知识,成绩就会更好,或者成果就会更大,所以我必须好奇。因为我觉得这样的好奇, 它其实是肤浅的一种好奇,它带着更多功利性。

真正的好奇心是快乐的。科学里的,科研里的一个什么东西,一个发现,或者甚至是一个不重要的事情,但是当它满足了你真诚的好奇心的时候,你是快乐的。那我觉得作为父母,作为老师,你得共情体会到这种快乐。就是孩子的好奇心,是他的真诚来自于他的快乐。

如果你跟这个快乐没有共情的话,你很难去欣赏这份好奇心。我觉得发自内心地去呵护这种快乐, 对你自己也是一种快乐。就是当你看着孩子因为好奇心,因为不管是好奇心的满足,还是好奇心的 motivation,让孩子快乐的时候,你其实是能感受到这个快乐的。

我觉得,大人、成人,很多时候感受不到这种快乐,是因为成人带着太多的滤镜吧。就是说,生活的滤镜,功利心的滤镜,这种压力的滤镜,和自己认知的滤镜。这些滤镜让成年人不容易感受到共情这个快乐,不容易共情这份好奇心。所以我们往往就无意识的,无法保护好孩子们的好奇心。

还有呢,就是说实话,人生成长的过程,变老的过程,有很多很多的事情会容易觉得没有年轻时候好。但是,好奇心的快乐永远不会变。所以,我觉得成年人自己应该也有快乐的能力。应该appreciate自己的好奇心,因为这是一个快乐的源泉。至少我自己觉得,跟年轻人在一起,跟他们学习,看到自己这么多不懂的,或者有时候自己去学一个东西,就是很快乐吧,它就是一种本能。

赵何娟: 这个很重要。就是因为我们大人有时候自己容易失去快乐的能力,然后我们反倒去把这种压力带给孩子。所以可能我们自己先快乐,先学会快乐。

李飞飞: 自己先要appreciate自己的好奇心。

赵何娟: 对,那现在有什么事情会让你感到快乐呢?

李飞飞: 我觉得现在创造特别让我感到快乐,就是create,不管是 create技术、create一个团队去攻坚很 难的问题,或者是create 一个idea,或者是去学到一些 idea,这些都让我特别特别快乐。所以我 这么多年喜欢在科研前线做事情,喜欢和学生们一起做事情,包括喜欢和年轻人一起创业,这些都让我特别特别快乐。

赵何娟: 真好。但是,我们也会看到就是,快乐的同时也会经历很多的困惑。那么在面对困惑的时候怎么解 决,或者说怎么去面对自己的困惑,或者自我怀疑。就像从您最早从物理学转向 AI 的时候,也有过很长一段时间的叫“彷徨”吧,选择实用,还是选择这个纯粹的科学。您怎么度过那段时期的呢?

李飞飞: 我其实一直都很惶恐。因为我觉得当一个人在探索过程,不管是科研的探索,还是人生的探索,你永远会处于惶恐的阶段。如果不惶恐的话,就太……太舒服了就说明没有去挑战自己。然后我又是一个喜欢挑战自己的人,所以搞得我,我觉得我一辈子都在惶恐。那既然一辈子都在惶恐的话,那 就学会怎么接受这个惶恐,学会怎么和惶恐打交道啦。那就是说,它就是一部分了。就是说,你不可能完全不惶恐。

我觉得我现在每天都在惶恐。但是呢,除了惶恐还有很多其他的。第一,就是说,确实太惶恐了也没用,这个还是得一步一步地做事情。我觉得,尤其是做过很艰难的移民或者是什么的,你会发现, 那么多未知,你能做的就是把今天做好。所以我前段时间在一个硅谷这边那个Y Combinator,跟一大群年轻的创业者聊天的时候,我就跟他们说,我说就Gradient Descent,这是一个机器学习的概念,这就是一个很重要的一个deal with你这个惶恐的一个办法。

那另外一个就是带着一些信念了。你要有勇气,有一些信念,也要有一定的自信。这种信念有可能, 即使是有勇气,即使是有自信,即使是你做了很久很久,你还是会输。但是,那就,输就输呗,至少你自己try过。那输就输呗,这个怕啥。

赵何娟: 那您现在每天最惶恐的是什么?

李飞飞: 我惶恐太多的事情了。我现在创业嘛。然后,我惶恐我们的模型没有做好,我惶恐我们的产品还没有找到定位。我最大的惶恐是,这么优秀的一群小朋友们,能跟我一起做,我不能辜负这群小朋友。 这是我最大最大的惶恐。我可能也不能辜负投资人,但是我觉得不辜负小朋友对我来说,比不辜负投资人还惶恐。

我的每一个同事我都叫他们小朋友,因为我觉得他们好年轻,好优秀。在我的心里,就是这些小朋 友都是我的老师,但是又都是信任我的人。所以我就特别地,我就特别在意,就是,我要很努力不辜负他们。

赵何娟: 我看有一些您的学生也在创业,包括有一些机器人的项目也在做,您怎么看待学生去创业这件事情?

李飞飞: 我非常非常支持他们,而且我也非常,我也替他们骄傲。创业这件事情一定要有一种信仰。就是说每个人的信仰是不一样的。尤其是创业者,尤其是founder,你必须要有比别人更多的信仰。从小就在这个AI的大时代长大的,他们的见识也比我宽多了。所以我都挺替他们高兴的。

为什么只有“空间智能”才能实现AGI?

赵何娟: 可能因为您是学视觉的,我能感觉到您对视觉这件事情其实有一种执着,或者说有一种执念,这个跟大语言模型是不一样的。

但有很多人也在说,叫“语言即世界”,或者“信息即世界”的。像 Anthropic的创始人也在说,未来的整个世界就是一个数据化的世界。我觉得大家其实都在讲同一个事情,就是我们怎么去观察和认知 世界,怎么用AI最终能够把这个世界给呈现出来。然后您可能更多在意视觉这块,而大语言模型可 能更多在语言这块。

一年多的这个创业之后,您觉得这种执念还在吗?还是依然认为,就是整个世界不能只是语言构成 的,可能它是一个更多,一个三维、四维,甚至更空间智能的一个世界?

李飞飞: 对,我坚信这个世界不光是语言。但是呢,我觉得,我先说一下我的信念。但是我觉得在技术上呢, 确实这里边有一个相通的概念,所以我也能理解有些人说语言即世界。那宏观地来说,我坚信这个世界不光是语言。如果我们语言的概念,就是用这种离散的、discretized 的这个token的信息, 而且相对来说是,是一个one-dimensional,虽然它表达的东西可以不是 one-dimensional,但 是语言本身的 representation 还是比较one-dimensional 的。

那我觉得这个世界,其实还是更丰满。就是我一再地强调,空间智能它有很多的性质,包括物理的 性质这些,它都是超越语言这个概念的。而且有很多就是,不管是人类的行为,还是大自然的行为, 我觉得是不可能用语言来完全表述,也不可能用语言来做到想做的所有的事情。我们每天从睁开眼 睛开始,你就想象我们每天作为人,我们的生活,从生存到工作,到创造,到感受、感知,到这个 更丰满的,这个人与人之间的情感,各种生活,不是只是用语言能做到的。

当然“语言即世界”这样的话,我觉得是挺好听的,也听起来没错,因为它是一个非常非常笼统的一句话。就是当你一句话很笼统的时候,就有点,还行,错不了。

但是,技术上,我觉得现在,数字那是肯定的。就是说,包括视觉模型、空间智能、机器人模型都会数字化。那我就不知道如果是,如果数字和语言成了一个等同体,就是the same thing的话,那这个概念就有点换掉了。那如果是把数字也叫成语言,那行吧,那你就啥都是语言,那我也没法争论这个问题了。

赵何娟: 对,可能就是,其实就有点像那个维特根斯坦,他是说信息即世界。就是说,如果换在信息即世界这个概念来说,可能就,大家其实是在同一个概念下面来理解了。

李飞飞: 那信息的话,在我看来,信息是不光是语言的,它还有空间的信息。空间信息我觉得是和语言一样美,一样大的信息。

赵何娟: 但是我们现在也遇到,就是我们现在在做空间智能,或者在做世界模型,它的技术可能又没有大家 想象中发展那么快。这个当然也是您现在在创业的这个方向。所以您觉得在这个方向上的创业也好, 或者说叫探索也好,它大概需要多长时间,能够真的看到有一些大家能感知的变化?

李飞飞: 其实我觉得快和不快,这个真的很难说。说实话,你看从我们创业到今天才一年多,那个从视频模 型到这个real-time 的 video 模型,到这个多模态的模型,到我们自己,当然我们还比较,就是说还没有太大规模地推广,但是也是我们的三维模型,这个变化其实还是挺快的了。但是因为我觉得AI这个大环境,大家对AI 的期待,真的搞得就是,有点太激进了。

赵何娟: 总觉得还不够快吧。

李飞飞: 对。我自己,当然了,这快和不快咱们说了算,也没有什么意思。但是我可以跟你说,为什么我要选择创业,就是因为我觉得,我觉得时间点到了。

因为,因为毕竟创业和搞科研不一样嘛,这个创业还是要跟市场结合,非常尊重市场。但是呢,比我优秀的企业家都会说,那时间是最重要的,在这个企业的创业,你不能太早,太早了这个市场和 技术都没到,你也不能太晚,晚了的话也没你的份了。

空间智能这个技术,在World Labs建立的时候,还有点早,但是没有早到,就是还有5年到10年。 我是觉得在今后的一两年里边,会呈爆发式地(增长)。你看这个视频技术,视频生成的这个长足进步,到我们做的World Models,因为这种,我是坚信,可以看到一两年内的这种长足进步。那么我能看到市场的这个应用的可能性。所以我觉得,我也不知道这是快和慢,我就觉得这是一个很好的时间点,做空间智能。

赵何娟: 您说未来一两年就能有爆发性的一个发展?这个已经很快了。这个比我想象中都已经快多了。我原来想就是,至少都要5年吧。这一两年就能有爆发,这个非常快。

李飞飞: 我是希望了。因为我觉得我们现在在做的这个模型,还是很exciting的。

赵何娟: 正好说说您这个现在World Labs的这个model的一个进展。

李飞飞: 我们在做world generation。那就是生成世界。而且我们觉得,就是说有很多很多的应用,从这个digital creatives,到 game development,到 film,到design,到 architecture,到 VR、XR、AR,到 robotic simulation。

这些大的每一个我说的,前面说的这个市场,它其实又细分很多很多。但这里边都有很多的对这个三维空间的诉求。而且,生成式AI 有一个很特别的现象,就是说,因为它lower了原来很难做的事 情,那么它就open up很多你想象不到的一些市场。

生成三维空间其实是很难做的。这个世界上有多少人有这样的能力去生成三维空间?他们用的工具 其实是很麻烦的。我自己试着用什么 Blender、Unity,我头都大了。但是实际上这些 creator,他 们脑子里有各种各样好的想法,它其实是局限于tools,而不是说局限于他脑子里的想法。

那AI是可以赋能的。同样的道理,AI可以给这些 existing creators 赋能,它也可以给很多人,他 都不知道自己能、可以做到这个,因为以前太难了。就像我这样的人,我以前是不用Blender、Unity 的,我觉得太烦了,我也没这时间。但是当AI能给我这个能力的时候,我当然会 用了,因为它给我带来很多新的灵感和新的可能性。

所以我认为,3D world model特别exciting,就是它是一个很难做的事,它是对很多normal human都很难做的事。那么,能让AI把这个capability降低它的门槛,它就是打开市场的一个非 常好的一个机会。

赵何娟: 如果您攻下来了这个堡垒的话,是不是就意味着通用AI最后一个关节就彻底打通,算实现通用人工智能 AGI 了?

李飞飞: 我觉得如果说没有空间智能,或者说没有整个三维的这个世界generative的这个模型的话,还不算AGI。我觉得AGI 就像一个门,那上面有好多个锁,这个可能要很多钥匙去,不同的钥匙去打。我确实认为,空间智能是其中一把钥匙。但这么说也不合适,因为这个门它不是,它不是说,黑白的打开和不打开,它其实是一点点被打开的。

所以我一直说,我都不知道什么叫AGI versus AI。因为AI和AGI,似乎我们的梦想是一样的。这 是一个scientific的好奇心,就是 machines能不能think,能不能do things。这个就是AI当初的梦想。那AGI的梦想好像也差不多。所以我不知道AI和AGI的区别。但不管是AI还是AGI了, 这个梦想是一步一步达到的。我们每走一步,都离这个梦想更进一步。

空间智能,一定是通往这个梦想的一部分。因为就像我说的,不管是我们人类自身的 creativity 的赋能,我们的,从游戏到设计,到工业,就不管是工业应用,不管是自身的赋能,还是给机器人赋能,还是我们的想象的这个 metaverse、元宇宙、AR、VR 的这个内容生成和应用,都需要空间智能。

赵何娟: 我有一个印象非常深刻的,你举过一个关于视觉的一个例子,就是讲那个三叶虫的故事。三叶虫花 了几亿年的时间,才把自己的一套复杂的视觉系统进化出来。但现在我们要做的其实是要给 AI 赋能 这么一套复杂的视觉,还不是模拟的世界的一个系统,而是生成世界的一个视觉系统。这个难度就 是可想而知,就是你要几年的时间去对抗几亿年?

李飞飞: 我不敢想象。就是,但是你不能这么想。因为我觉得就是说工程、数学,它的路径和进化的路径是不一样的。所以说,这个是苹果和橘子之间的比较。就是,这么说吧,进化的迭代很慢很慢的,比这个算法的迭代慢多了。然后,碳基和硅基,它的这个运算也很不一样。所以说从时间上的话,我觉得是不太有可比性的。但是,它还是给我们很多 insight 和 inspiration。

就是比如说,这又说到数据了。就是为什么数据那么重要?为什么当初我们实验室提出数据这个概念?那也得到很多进化的这个灵感。就是因为,漫长的进化岁月,实际上就是大数据,大数据训练 的一个岁月。是吧?所以,那么我们现在因为在数字时代,我们不需要去等几十亿年来 collect 数据, 我们可以大规模地 collect 数据。

那这些都是,说到底它又回到这个,是相同的一个概念,只是它的这个执行是完全不一样。它跟进化,跟大自然执行这个是完全不一样的。

赵何娟: 它不是那种,那个用时间去进化的一个过程。它甚至可能是线性,不是线性进化,它甚至指数级的一个变化。

李飞飞: 因为数据很多嘛。你等于就是说,同时可以,你一次看的数据,可能是进化几千万年看的数据。是吧?你不能去完全去做这个相似的比较。

为什么认为算法比数据更重要,这是一种偏见?

赵何娟: 说到数据,我们可以回顾到您之前开始做 ImageNet 这件事情。ImageNet 本质上做的是一个数据的事情。但是是用一个更 community 的方式,然后更大的数据方式,来把 AI 往前推进一大步。

李飞飞: 现在看已经很小了。但是那个时候确实是最大的。

赵何娟: 但那个时候做的时候,其实你也遇到很多挑战嘛。因为有很多人会质疑。首先是质疑说 ImageNet 这件事情,然后另外一个就质疑说,ImageNet 做这件事情,背后其实基于的原理,就是说数据越大,它的计算能力越强,它训练数据越多,它的智能程度越高。这个原理本身,在当时其实是没有人信的。我们现在再回过头去看那个时候就是,那您为什么那个时候能坚定地相信这件事情能够坚 持下来?

李飞飞: 其实我觉得相信自己的一个 hypothesis,也不是一件很奇怪的事吧。如果是在科学的路上,你对自己的一些假设,深度思考以后的假设完全,你总得有这么一些假设,你是会相信的。当然作为科学者,你也得会知道有些假设就是错的。那肯定我有很多很多错过的假设。

但是这个假设是,因为是我,可能就是想了很长时间,也确实是,它数学上,它是一个就是 generalization 的一个概念。当时做了很多模型,我整个博士都是在做模型,做算法,还是积累了 很多的一些 insight 吧,然后意识到了。

AI最终说白了,数学上,到今天做的一件事就是 generalization。说白了就这件事。那你generalization怎么实现?其实就是两方面:算法和数据。而且它们两个是息息相关的。算法太复杂,数据少,你就overfit。数据太多,算法不够好,也是 overfit。所以它其实这里边是有一个数学关系的。

那我当时,想了那么长时间,也坚信,而且我是算计算机视觉,比较早期的,做机器学习的那一代博士生。所以我很幸运,就是说,我的博士研究是在计算机视觉的一个转折点,我们用了很多机器学习的概念。所以我对这个就理解比较深刻吧。也不一定就我一个人理解深刻。但是我那个时候就看到了数据的重要性,所以就坚持下来了。就回到好奇心了。我觉得那个过程还是挺好玩的。因为当你在为一个假设求证的过程,其实挺好玩的。你充满了激情。然后就是一路打怪。就打呗,只要还没被妖怪打死,你就继续打呗。

赵何娟: 就像升级打怪的一个过程。现在又从 ImageNet 那个时候,到现在这个World Labs,又回到一个算法和数据的关系的新的十字路口了。现在在作为世界模型,或者作为视觉模型来说的话,数据可能又成为一个特别特别难的一个问题。

李飞飞: 瓶颈了,对。

赵何娟: 这个瓶颈怎么去打破呢?就是因为,你想空间我们怎么去获取?我摸一下这个东西,我是觉得它是热的冷的,然后,这个更难了我感觉。

李飞飞: 是。所以这个就是螺旋形上升。当年 ImageNet,让计算机视觉有了最大的数据库,然后计算机视觉就蓬勃发展了。然后这个互联网,带来了这个自然语言的大量的数据,那这个大语言模型又蓬勃发展了。然后这个,回到视觉,当然现在因为 AI 整个饼大多了,也不能只说视觉。

那你看视频模型发展得那么快,也是因为有很多视频数据。你看这个自动驾驶发展得这么快,也是因为至少有一些公司,也有这个很大量的自动驾驶、路况、各种数据。所以你说得对,现在就是又回到了数据和算法。其实不叫又回到,就从来没离开过了。

但是确实又到了一个很关键的一个关键点。

赵何娟: 对,对。

李飞飞: 我有时候觉得很好玩,即使是走到今天,大家还是更看重算法。但是所有真正做 AI 的人,不管是创业的还是大公司的,所有人都知道,数据,不说更重要,至少是平等重要。但是好像这个说起爱, 算法还是更 fancy。实际上真的,数据是一个科学。

赵何娟: 是,就是好多人会把算法,甚至说算法工程师的工资,都能比数据工程师的工资高好多。就是在这 里面,确实大家好像对这两件事情的认知,认为的难度也好,他的想法好像是确实是不太一样的。 好像就觉得数据没有那么 sexy。

李飞飞: 人类的,人性的弱点之一就是偏见。

赵何娟: 你觉得这是一个很大的偏见对吗?

李飞飞: 其实我觉得偏就偏呗。这世界反正也不完美。这个,就是,我真的这方面就皮比较厚。你说我觉得 它是不是偏见?你要让我说这句话,行,它也是偏见。但是我是不是就要去抗争这个偏见?我觉得 我懒得去抗争。我自己知道就行了。

赵何娟: 那现在这 World Labs,怎么去解决这个数据瓶颈的问题呢?

李飞飞: 那这个我就不能告诉你了。

赵何娟: 这是商业机密是吧。

李飞飞: 对呀。

赵何娟: 但是我可以想象,就是说如果相信,一两年内会有爆发这一点的话,我觉得你肯定找到了突破一些 世界模型数据瓶颈的一些方法。我很期待。

机器人模型还需要多久?

赵何娟: 回到刚才说的这个自动驾驶这块。其实我也也想问,自动驾驶的这个模型,是不是其实是一个缩小版的,或者是一个简化版的世界模型?

李飞飞: 它应该是。它确实是应该是。我希望它是。当然我不知道特斯拉、Waymo 它们是什么,里边有没 有什么很多 3D 的信息。

自动驾驶汽车其实就是机器人啦,它是人类最早的这个海量生产的机器人。但是这个机器人非常有限。这个机器人是什么?它是一个方盒子,长方形的盒子,基本上是在二维的世界里,因为路面是 二维的,它不是三维的。而它在这个二维的世界只做一件事,就是不要去碰着别的东西。但别的东 西有些是车,有些是路上的行人,有些是街边。那不管怎么说,一个方盒子的机器人,在一个二维的世界不要去碰东西。

你想想,我们今后要做的三维的机器人,在三维的世界,它的目的就是去碰各种各样的东西,然后帮我们洗碗、做饭、叠衣服。所以你就知道,这个汽车还是一个很简单、很简单的机器人。

赵何娟: 确实很简单。

李飞飞: 所以我就说这个,汽车这个世界模型也更简单。因为它做的事儿简单。当然了,我不是说汽车不了不起,我觉得特斯拉和 Waymo 都很了不起。但是站在一个科学的,就宏观地看这个世界模型和机器人,你就知道这只是开始了,下边做的事还复杂得多。

赵何娟: 我们如果说,再把现在的这个自动驾驶的,这种像我们能理解的,或者说我们现在能接触到的所谓的,能感知的空间模型,其实就是低配版的世界模型也好,就是自动驾驶这个模型。但是自动驾驶 这个模型,它确实能处理的问题,又是相对简单的问题。离我们真正的机器人模型还很远。

李飞飞: 而且总的来说,当然了我真不知道特斯拉他们内部在做什么。但总的来说,我觉得它不是一个以生成式空间模型、世界模型为主的。因为它不太需要去做生成。

也许它在训练数据需要,但是我都不知道,我不知道特斯拉内部有没有生成式的。因为它主要做的 事情不是生成,而是去做很多判断,recognition、detection 这些。所以我对这个,特斯拉它的那个世界模型,我觉得我不是特别的了解。但是我不认为它是一个很强的生成性的模型。因为它不需要做这件事。

但是机器人需要。机器人做训练需要。因为你不可能有那么多数据。我们做的事情就是跟 creativity 有关的,跟design有关的,这些都需要。因为生成本来就是一个use case。

赵何娟: 那正好说到机器人模型这件事情。我看到您跟英伟达那边也有一些合作,在做这个机器人的这块的模型。我们知道中国机器人现在这个产业就是非常的红火,然后有很多融资,有很多创业公司,但 是中国更偏向在机械智能这块,可能在制造、在机械这块。在 AI 模型这块,我觉得现在就是,尤其生成式模型这块,突破还不是很大。就你怎么看现在机器人的生成式模型,这个发展现在在什么阶 段?

李飞飞: 我觉得机器人是一个很好玩的事情。就是说,现在硅谷机器人很火很火。而且我自己实验室也做了十几年的机器人。我有很多优秀的以前的学生,各个地方引领机器人的这个研发。不管是创业公司也好,还是大的公司也好,都有我的学生在做机器人。所以我非常非常地喜欢这一块,也看好机器人。

但是呢,我也确实觉得要很冷静。就是机器人它的研究还是在早期。第一就像我们说的,机器人真的是缺数据。这个,你想想做汽车这件事情都做了几十年,而且汽车还有很多很多的人,一边开车 一边在搜集数据。这个机器人是,它基本上没有商业化的应用场景,尤其是在日常用,没有太多商 业化的应用场景。所以它的数据很难收集。

那么,走生成式AI这条路,就变成一个很有意思的、很有前景的一条路。而且生成式AI,尤其是视 频生成这些,它其实提供了很多训练的不同的想象空间。你可以做 simulation,像我们做的事情, 做 robot simulation 是很有前景的。你可以做这个,甚至在 inference time,用这个视频模型去 帮助online 的这个 planning。

所以就有很多很多的,可能是因为,这么说吧,因为机器人旁边的领域,Generative AI,它的这个发展很快,所以它在带动机器人的,机器人的发展。所以我觉得很 excited。但是还是拭目以待 吧。我觉得机器人倒是还有一段路要走。就是从现在到商业化,真的还有一段路要走。尤其是日用, 日常用的机器人。

赵何娟: 工业机器人可能会快一点,对吧?

李飞飞: 工业机器人早就在用了。

赵何娟: 更智能的工业机器人。

李飞飞: 对,因为它毕竟,它的场景比较这个单一,它可以 constrain。然后它也有很多data 嘛,数据。

赵何娟: 如果说我们现在看到机器人这个行业,未来还有比较长的路要走,中间一个很大的瓶颈其实是数据这块的话,有没有一些新的机会,就像您刚才说这个做 robotics 的模拟数据这块的,这样的创业公 司是不是也有一些机会?专门去做数据创业,是不是,或者说现在围绕机器人数据的创业,是不是比直接做机器人创业要更好?

李飞飞: 数据公司还是有很成功的。你看前段时间那么火的 Scale AI。Scale AI,不就是一个。所以说数据 是一个商业机会,我完全相信。但是怎么做,这里边,英文有一句谚语叫 "The Devil's in the Details"。所以说就是怎么做,怎么做好。

因为你做数据最,最重要的事就是,第一,你的市场有多大。第二,就是你能不能做到客户想要的数据。那这些都是很重要的。然后机器人的数据,机器人的数据真的是不容易采集到。因为你需要机器人去采集机器人的数据。你让人去采集机器人的数据的话,scale 的这个,也挺慢的,是吧?它不像车,因为车已经在路上跑了,它真的就是采集数据很快。

赵何娟: 对于现在的机器人行业确实存在两个难题,一个是数狙淌题,第二个,就应用场景。其实这个也是, 就是因为没有数据的足够地发达,它的应用场景就会很有限,这个相关联的。但确实就是大家也感 受到,就是说,好像没有特别强的这种应用场景。最好的像宇树,现在也是以表演性为多。

如果说,现在我们要把整个机器人作为一个发展阶段来说的话,你觉得这个阶段是很早期很早期的话,那还有哪些挑战,或者说需要多少年的时间,才能把这个周期跑完?中间还有哪些节点要待突 破?

李飞飞: 我只能告诉你这么一个数据。就是从自动驾驶这个概念开始,到商业化,谷歌是在 2006 年成立了 一个很小的自动驾驶的研发团队,到 Waymo 是在 2024 年上路的吧。所以经历了快 20 年吧。但是呢,这里边有一些可比性,也有一些不可比性。就是比如说,汽车这个行业非常成熟,它的所有的 supply chain、OEM,它的 use case 都非常成熟。所以这一点呢,它比机器人快很多。但是呢, AI 那个时候不成熟。所以这个自动驾驶,走了很长一条 AI 的路。那现在 AI 的路肯定会走得更快。

但是除了工业机器人,或者是有限的工业机器人,又没有什么像汽车一样成熟的机器人的应用场景。 所以这里边,这条路是不是会走,比 20 年快,还是比 20 年慢,其实很难说。

但是我相信,AI 比这个当年自动驾驶要快一些。但是我们又回到刚才(说的),就是它的问题,也这个更难一些。它是更三维世界的。所以,我其实经常被问到这个问题,就是我觉得还有几年这些问题,我其实很不愿意回答这个问题。因为它很复杂。这个问题有很多,我只能说,我相信我的有生,咱们的有生之年一定会看到。

赵何娟: 拭目以待。虽然我知道这个里面有商业机密,还不能透露,但是我可以想象一下整个的空间智能的那个视觉,复杂视觉系统发展长河的话,就是,你觉得现在这个阶段,跟三叶虫的进化那个阶段, 那个 4 亿多年的进化阶段,你觉得处于哪个位置?是处于那 4 亿多年的早期,还是 4 亿多年已经走到中期了?

李飞飞: 哇,我其实觉得很难比。你这问题问得好。我有时候自己也想。我觉得现在的这个空间智能,尤其 是一些多模态的这个模型,有些方面已经远远超过人类。比如说,物体的识别,那早就超过人类了。 就是说我们能认识多少种狗,能认识多少种鸟,多少种车。那 AI 肯定这方面已经比普通人好多了。

还有就是,人其实三维的,三维理解不错,但三维的生成我们是很糟糕的。一般正常人,除非你去 上了学,做三维生成都很(一般)。就脑子里做三维生成很一般。不是说小孩子在玩泥巴,那个三 维生成是,他带着一些,具身的一些参与。就是脑子里,然后叫你画出来一个三维生成,这都很差 劲的。那 AI 也可以做到一些非常非常优秀的。

但是你说今天我们的空间智能,能对,就人睁开眼睛,我们对我们的三维世界的,那种深层次的理解,它的这个,有些时候从细节到,物理世界的各个物体的关系,甚至它的这个材料,它的这个物理属性,它的这个,那我们又有非常非常这个丰满和丰富的一些智力在里边,是吧?那还更别说我 们对 social 信息的理解,人和人之间的理解,这些都是视觉理解。

我没有在说语言。人又非常非常的复杂。所以,你说这从这个进化,我觉得有些方面它已经跟人一 样了,甚至超越了。那有些方面的话,确实远远还不如人类。

而且即使是我们,我作为一个科技人、AI 人,对空间智能的信仰,它也不是纯粹地,盲目地信仰。 它是一种带着对科技的理解,和这么多年深耕这个领域,我走到今天,或者是我和我的同事们,我 们看到这个技术的机会,和这个技术的发展方向。它也不是纯粹的,是一个带着情怀就够了。情怀需要,创业需要情怀。但是对科技的判断、发展和理解,还是需要很强的逻辑和科学的判断。

赵何娟: 有科学的严谨性的推理在背后。

AI的未来发展,小鲍司机会更大,还是大公司赢者通吃?

赵何娟: 我们大家现在把所有的焦点和关注点,都放到的是几家核心的大公司上面。就是比如说像 Google Gemini,或者是 OpenAI 也从一家小鲍司,现在变成一个巨头了嘛。Anthropic 其实也变成一个巨头了。都放到这些巨头上面。然后美股也是所谓七巨头、七姊妹这样的。那你觉得小鲍司在这个浪潮里面还有机会吗?或它的机会又在哪里呢,尤其对新的创业者来说?

李飞飞: 我希望有。因为我的公司就是小鲍司。但是希望归希望。就是这个问题,其实提出来是有道理的。 因为数据的整合,资源的整合,从数据到算力到人才,现在属于这种,就是能整合的这种公司,它的这个存活和赢率还是更大。

但是我觉得,我们不能只看这些比较显性的因素。因为显性的因素很简单,容易看到,所以容易被 传阅。

但是我说一个很简单的例子,就是 AI coding,是吧?就是 Microsoft是第一个做AI coding的吧? Copilot。它有所有的天时地利人和。真的是有所有的天时地利人和。它有所有的资源,它有所有的场景,它甚至有 GitHub 都是 Microsoft 的。对,那它怎么就没做出来?

现在这个,硅谷比较火的 Cursor,包括 Claude Code。就怎么就是在这样的一个情况下,一个小鲍司可以突破重围?这就是说明,有很多显性的因素是不够的。

如果大家都在不断地去看这些显性的因素的话,它实际上这个判断就有偏差。人类历史上没有一个时代,只有大公司有赢率。没有一个。而这些时代也好,社会也好,很多东西,很多时候这些大公司也都有很大的资源整合能力。所以我觉得这里边就涉及什么?这涉及创造力,涉及机会,涉及执行,涉及这个时间。这些都是元素。

再加上,我觉得 AI 确实是一个 horizontal 的技术。也就是说,它可以提供很多应用级别的机会。大 公司做不完的。它的这个这些机会,那小鲍司有太多的机会,去把这些应用做得非常好,做到极致, 慢慢地撕开市场。这都是有可能的。

赵何娟: 所以对于小鲍司来说,可能就是去选择这些 vertical 的应用机会,是不是会更好,更有机会?

李飞飞: 对,看是什么样的小鲍司。我觉得没有能力做这个基础模型的,做大模型的,那你肯定是更需要选 择应用级别的。应用级别也不是说只是 vertical。包括我们公司,我也不知道你说,它是小还是大, 其实我觉得还是算小。但是我们也有足够的能力做这个 foundation model。那我们也会做 model。

赵何娟: 做 model 的必须得有您这样的基础才行。

李飞飞: 确实是,对。就是说你做 model 的话,你的人才这些,它的结构是不一样的嘛。

赵何娟: 对。我们说到这,就是有一个您经常提的理念,就是 AI for Good。就是您觉得 AI 要更普惠,给普通人带来好处,不能只是掌握在少数人的手里,应该看怎么让 AI 更好地为人、向善来发挥作用,而不是作恶。这点我觉得也是一个很有意思的话题。这个对于科学家来说其实是,很多时候是两面的。

就是您包括 Geoffrey Hinton 教授,他最近也是一直在提这个,就要警惕 AI 可能带来的比核弹更大 的毁灭性的这个作用。但也有另外一个观点,就是说我们现在是在发展阶段,应该少提 AI 带来的威 胁。从您的角度来说,这个阶段您觉得我们要更看重发展,还是可能像 Hinton 教授一样,我们可能 要同时要更好地做好安全和对齐?

李飞飞: 其实我觉得这个事情挺 common sense 的。就是 AI 是工具。那工具就是双刃剑。人类的每一个工具,小到一个,最初这个一把火,一个石头做的斧子,大到这个你说的核弹也好,生物技术也好, 这个 AI 也好,它都是双刃剑。那我当然认为,我们对工具的使用是应该向善的。但是同时也要防止 工具,它被运用错,或者是被有意地、无意地用错,都是有可能的。

所以我认为,两边的极端都不够理性。就是说,你说只发展,完全不 care 它的这个安全性和向善性, 那绝对是 disaster。但是,如果只是天天去讲它的这个向善性、伦理性,不去发展,那也会失去很 多机会。毕竟这个好的技术,是可以带来很多福祉的。

所以我就经常跟媒体说,我觉得我其实对媒体没啥用。我是一个很,我说的话都很 boring。就是说, 没有那种一下子放一个大炮似的说我只相信非黑即白。我说的是最 boring 的话。

赵何娟: 但是这是科学家的严谨。

李飞飞: 其实我觉得这跟科学家没有关系。这是做人的常识。就是,就像你就回到做父母,你说你教不教你 的孩子用火?你肯定要教你的孩子用火,怎么做饭。那你教的时候,你肯定做饭的好处你得教,用火的好处。那用火的坏处你也得教。这其实真的是一种常识。

赵何娟: 那我们如何在AI发展的过程里面,让 AI 更好地普及,或者说普惠大众,而不是变成一种权力呢?就 是我现在越来越觉得就是,当技术可能掌握在少数的巨头,或者掌握在政府手里的时候,它有可能 会变成一种权力工具。那怎么把这种权力工具,不是变成控制人类的一个方式,而是变成惠及人类的一个方式?

李飞飞: 对,你说的对。AI 是一个权力的工具,它也是个向善的工具。它永远是一种工具。在我看来,这工 具会变得越来越强大。但是,在它变得不可控之前,它是人类的工具。人类有责任让它可控。

但是就像其他工具一样,我们对其他工具的期待,永远不是说让这个工具去 figure out 要做什么。 向善也好,这是人类的责任。所以我觉得对 AI 的控制,对 AI 怎么去引导,这是人类,这是法律,这 是制度,这是教育,这是社会共同的责任。每个社会不一样,每个个体也不一样。但是这个责任在 人类。

人类如何不被AI替代?

赵何娟: 这个就是,您在书里面也最后也有提到嘛。就是 AI 并不是要替代人类,就是很多东西是 AI 没法替代 的,包括共情这件事情。就是情感的这个交流,这件事情可能作为人类自身的需求,也是很需要的。 所以,那我们怎么在 AI 发展里面,去设计,或者说在它发展过程中,去做一些什么事情,让它能够 保持,让人类本身的人性闪耀的一面,还能够保持不被替代呢?

李飞飞: 这问题问得挺好的,何娟。我觉得是这样的。我觉得我们真的是要理性地看待 AI 是什么。然后用理 性的方式去思考,今天的社会需要什么。比如说教育,我就觉得我们太需要在 AI 的时代,更新我们 教育的理念和教育的方式。我们需要让孩子们用这个工具,让孩子们学会知道,这个工具可以让他 们的创造性也好,学习也好,赋能很多。但是同时也要让他们知道,这个工具有可能出现的问题。

而且这不光是教育孩子,我觉得成年人的世界,最大的一个问题就是,我们以为需要教育的是孩子, 实际上最需要被教育的是我们自己。所以就是教育自己,教育公众,给公众足够的信息,给政策和 法律制作者更多的信息和学习的机会。这些都非常非常重要。

说到最后,我们对 AI 的发展和治理,其实就是我们自己的,自身的学习、发展和治理。真的说到最后还是人的问题。

赵何娟: 对,就是自己的这个教育,可能是更难的。就是反倒是更难的。因为要跟人性做斗争这件事情,比跟AI较劲,要更难。

李飞飞: 对,确实是。

李飞飞: 我觉得我们在这个 AI 的时代,尤其是一个有智力能力的工具,其实给我们的启发应该是,我们应该 更好地了解自己,更好地治理自己。这个自己既是个体也是群体。所以有时候我自己觉得,这个 AI 的这个讨论,就是沸沸扬扬的。有时候,有时候我就觉得,大家很热衷于讨论AI。其实,其实说到底,人性,个体的人性和群体的人性,欠缺的还是自省吧。

赵何娟: 其实我们可能在 AI 发展过程里面,反倒要更多讨论,有更多机会来讨论,人性本身的发展问题。包 括现在很多年轻人也很困惑。最近硅谷也在裁员。就我在硅谷也听到很多学计算机的,之前斯坦福 学计算机的,就是大家都是抢着要,现在也面临裁员。很多问题。就是很多人都在说 AI 会替代很多 工作,然后可能很多人会面临裁员,然后等等的各方面的这些因素在。

那我们在这个发展里面,就是不管像您说的教育,还是我们自己去认知这个世界,自我的自省也好, 我们应该怎么去来看待,现在 AI 可能给我们造成的冲击?不管是工作上的还是生活上的,甚至是情 感上面的这部分?我们自己应该做点什么?从我们人类本身来说,我们应该做点什么?

李飞飞: 我觉得个体和群体肯定有不同需要做的。

个体需要做的就是,认识这个时代是在变化。我觉得现在再去做鸵鸟,也不是一件好事。这个时代 确实在变化。工作会变。任何一次大的这个科技革命,都会带来工作的变迁。它甚至是阵痛。有些 阵痛时间短一点,软着陆。有些阵痛,它就不一定是软着陆,会带来社会的动荡。所以作为个体, 怎么去了解学习,again,这个又回到,就是还是保持一种好奇心吧。就是对生命的好奇,对于世界 的好奇。这个也是,就算你的好奇心在成年人的世界,来自于一种恐慌,那也行吧。这个至少,至 少有个动力让你有好奇心去学。这是个体的一个需要自省的。

作为群体的话,我自己觉得,这个社会在 AI 的时代都应该,就的我们教育结构,这个所谓的 K–12 的教育,就是让一群十几岁的孩子做各种应试,或者是做什么标准答案的教育。当然了,至少美国 这边是,它不只是应试,但是它还是包括应试。而且它的很多教学方法,还是一种带着知识的填充。 那这些我觉得都是可以更新的。而且应该急需更新。

因为AI在快速地证明,很多东西是机器可以做到的。那再让人去花十几年、几十年的时间,做一大半机器可以做到的事情,这是对人类的一种浪费。所以我自己特别想呼吁就是,思考教育的人,能影响教育政策的人,和在执行教育的人,去好好地把握这个时代的机会。

我们已经100多年,没有变过教育的这个方法论了。那我觉得,100 年以后,历史学家回过头来看, 21世纪的初期吧,上半叶,我最大的希望是,人类做了一次教育的革命。

赵何娟: 你期待的教育革命会是什么样子呢?就是比如说,我们应该去推动的教育改革也好,或者说革命也好,它的一个方向,还有具体的一些事儿,有哪些是你觉得特别期待?

李飞飞: 我觉得应该用AI去赋能教育者和学生。然后用大量的,AI 赋能以后,节约出来的时间和精力,让这 些学生们,当然通过老师的guidance,和自身的guidance去积累,认知和能力都是AI 做不到的。 就是,人类是有巨大潜力的。每个个体都有巨大潜力。我们的大脑没有被完全的用上。那我们的个体和群体,都没有发挥出我们所有的潜力。

你就看人类个体的差别,就可以看到这个潜力有多大。至少有些人,你会觉得他简直是非人般的, 超人般的能力。那你就会知道,其实这种能力是在人性是有的。我们很多很多人都没有发挥出来。

那有了AI这样的工具,或者甚至有了AI对人类工作的冲击,那这正好是一个契机,去重新思考整个 教育。我们真的是100多年没怎么变教育的这个方法论。我觉得现在,是一个彻底改变教育方法论的时候。从这个知识性的教育,到技能性的教育,到认知结构,到做人本身的教育,都可以有一个机会改变。

赵何娟: 但是我们也看到,因为这一波 AI 发展带来的,反倒不是说我们去,就是认知教育的这个变化,反倒 是,不管是在美国还是在中国,都越来越重视工科。一些就刚才您说的有一些,就认知层面的,可 能会是相对偏大家理解的所谓文科的这个教育,现在变得越来越不那么重要了。就连美国也开始谈 什么制造业回归,然后工程师教育,工程师培养什么这些东西。我觉得这个其实也挺让我困惑的。

李飞飞: 我觉得真正的教育的改变,我们不应该再分工科文科了。因为 AI 可以让所有人都学会 coding。那 你说这些人是工科还是文科?AI 也可以让很多人,变得更好地去感知美,或者是去读书,去什么, 去作诗。所以说,我觉得就这个方法论都可以改。以前是分这些工科文科。但是 AI 它给了你很多机会。

那天我们家小孩子在读《Harry Potter》,在问我什么,第五本书里边有一个什么,就是反正,就 有点很复杂的一个,就是我们俩都没搞清楚的这个,发生了什么事情。然后我们就用 AI 去问。我们 就用这个ChatGPT、Gemini去问。一个一个地就说,这个时候 Dumbledore 做了什么?这个时 候 Harry 做了什么?这个时候 McGonagall 做了什么?问了一大堆,我们就读懂了,就搞清楚,原 来是这样。这个小小的例子,就是,我觉得AI给了我们很多机会。

但是我也觉得,人,最后还是说,自己怎么去用这个工具。我其实最害怕的是人类的放弃;或者是 部分人类的放弃,就是觉得,AI 这么聪明,没我啥事了。这个很可怕。

赵何娟: 躺平了,躺平了。

李飞飞: 是吧?这个词我也不知道,很形象。但是就,这个很可怕。其实人类有太多太多的潜力。人类有太 多太多可以创造这个世界的机会。人类有太多太多可以把人类世界变得更好的机会。AI 就是工具。

赵何娟: 今天,刚才一直听您在说“AI就是工具”这句话,其实挺让我震撼的。因为我接触了很多朋友,包括做 AI 的,尤其是做科研的,做 AI 这个方向的。然后,反倒是一些不用 AI 的人,或者说不懂 AI 的人, 他们会认为 AI 就是工具。

而真正在从事 AI 这个行业的人,都经常会说,AI 不是工具,AI 是全部,AI 就是未来,就是世界, 我们不能只是把 AI 当做一个工具。因为您是这个 AI 真正专家,和科学家,这句话反从您的嘴里说出 来,我觉得还挺让我震撼。

虽然是简单的一句话,但这是一种,这是我们怎么去看待它,或者是认知 AI 的一个语言。语言是个gate,就是我们去认知世界的一个门。

李飞飞: 我觉得人性,人的 agency,我不知道中文怎么说,就是人自身的 agency 是最重要的。我们如果 放弃了自身的 agency,我们就放弃了我们改变自己和改变世界的这个,这个好奇。

或者是这个 motivation。所以,我其实不懂什么叫“AI 就是世界”。我真的不懂。那我也可以说一花 一世界。我不知道“AI 就是世界”这句话是什么意思。对,就是“AI 只是工具”这句话背后,其实是我们 怎么看待 AI 和人的关系。就人类把它当工具,意味着人类把自身还是看作更重要的一个,就是人类 要更关注自我。

李飞飞: 对,其实“AI 是工具”这句话,带着我对人的信仰吧。就是我对人性和人类社会的信仰。因为我信仰 的是人,我信仰的不是 AI。

如何面对谣言和AI可能的“坏影响”?

赵何娟: 您前面也说到,家庭给你有很多很珍贵的东西。能不能举一两个例子,就是家庭赋予你的这种珍贵?

李飞飞: 其实我在书里也提到,我就是,那本书其实写完了以后,我觉得那本书我在写我妈妈,不是在写我。

赵何娟: 对。我看了你妈妈的故事,你爸爸故事,我觉得特别特别好。从一个普通家庭,这么一步一步,自己通过努力成长起来。非常励志。

李飞飞: 是的,我们家庭是挺普通的。而且我们家挺小的。我小时候,我的记忆里有姥姥,但是爸爸那边没 有人。就是一个很小的很普通的家庭。然后我妈妈身体特别不好。不过again,就是也不是什么很 特别,有很多人家庭是这样。

我反倒觉得,它给了我一些很多很珍贵的东西,等我长大了以后才知道。因为小时候嘛,年轻时候 觉得,花很多时间在这些生存压力。但是,走过这条路才发现,哇,第一它真的是,它真的可以磨 练意志。这个“磨练意志”这种话听起来很大,或者是,老是说,说了也没用。但是你真的是,有过这 些经历,你是根本不用说,这个就练出来了。

第二呢,确实作为一个 AI 科学者,我做的工作那么的“机器”。就是跟计算机打交道,跟电脑打交道, 跟算法打交道,跟数据打交道。但是人生的经历,又赋予了我很多对人性的体会。那这个经历它的 复杂,尤其是生老病死,看到很多的这种,英文叫 vulnerability,就是做人的 vulnerability。其实,其实给了我很多视角。我觉得是很珍贵的视角。

但是,我在那个书的第十章,是专门写了我妈妈生病。我为什么要写我妈妈生病?是因为,我也算是在 AI 界很少的,我也不知道是不是第一个第二个,反正很少的,就是美国医学院院士。那我为什么拿到美国医学院院士?是因为我花了很多年做,就是因为做教授可以做不同的工作,不光是做 AI 了,我还做了一些跟医疗有关的工作。那尤其是叫 healthcare delivery。那我就觉得,我自己这 么几十年陪着妈妈,真的是在医疗系统摸爬滚打。

赵何娟: 久病成医。

李飞飞: 绝对的就是。而且就是,那么多场手术,那么多场大大小小的病,每天的这个照顾,每一次的这个, 它让我对医疗有了深刻的了解。那当我去做这些医疗,AI 赋能医疗的项目,我就觉得我跟别人的理 解不一样。我真的是多了更多的理解。它也让我能更好地找到这些医院的同事,因为这些同事觉得 我尊重他们。他会觉得,你也不是这个,只会说这个 computer science 的一个人,你居然能理解 我们的工作,然后知道我们的痛点。那这个绝对是给了我一个很特别的一个视角。

赵何娟: 挺了不起的。就久病成医,到还可以成院士。

李飞飞: 这个是人生没有白走的路。

赵何娟: 对,所以这也是好奇驱动。

李飞飞: 这可能既带着好奇也带着生存的,其实这个是爱的驱动。就是因为我爱妈妈,我想让她活下来吧, 或者身体好。所以我花大量的精力。这个真的是带着这样的一种驱动。

赵何娟: 飞飞教授,其实我自己存在一个很大的困惑。因为我们媒体行业您知道就是,近年来也都在讨论。 一个是 AI 对我们媒体行业冲击是很大的,接下来,我们这行业会有巨大的改变。当然我现在也在做一些新的产品,希望能够在这个 AI 时代,又成就一个更好的企业和产品。

但另外一个方面,我们也发现有很多跟我们的长期以来的这种专业主义新闻价值观,其实是有一些 冲突的。就比如说,现在 AI 可以自己生成这么多的内容语言,然后可以生成图片,然后网上的这种 fake news,然后虚假图片也满天飞。然后又没有办法,很多人也很难识别。现在连视频都可以作 假了。我们怎么来看待 AI 可能带来的这些虚假信息?我知道您也肯定饱受一些困扰,作为名人嘛, 就很容易在网上被各种谣言这个伤害。就我们怎么来看待这件事?

李飞飞: 确实是。对,其实有时候,我也特别感同身受。因为确实是经常有人给我打电话:你在哪了?又出啥事了?我说没有,我在家里睡觉。或者是各种各样的谣言。是挺多的。这个,而且有很多关心我的人,关心到都不敢给我打电话,说,哇你出这么大事,我们就不打扰你了。我说,我没出事。

赵何娟: 对呀,都好好的。

李飞飞: 对,所以确实能理解,也能感同身受。这就是我刚才说到,我觉得这里边有好几层。第一个就是公众教育。因为 AI 是个新事物。那我就在想,汽车刚刚发明的时候非常不安全。第一,根本就没安全带这个说法。第二,车速这些包括很多问题,人类都还是走了,不说叫弯路吧,应该说是付出了血泪的代价。那慢慢地我们让汽车变得更安全。但就是现在,那你的孩子是青少年,他有一天要开车 了,你肯定心里非常紧张,要给他好多好多的 education。

想想小时候,我记得我爸就说,你手湿的时候,永远不能摸那个插座。那这话我爸可能说了 200 遍 吧。这个,这就是教育。我觉得 AI 的不安全性,AI 的 fake news,我觉得公众教育太重要了。因为 它这个工具永远会被人利用。我相信你在媒体就看到,你防不胜防。有些确实是,比如说前段时间 有关于我的假新闻,我就问了一个新闻界的朋友,我说,这假新闻怎么这么多?太牛了。

赵何娟: 其实我当时看到那些新闻,我也特别想给您发信息说,这是真的吗?

李飞飞: 对呀。我都不知道。就是后来我才了解到,我这做 AI 的人,都没有意识到 AI 在里边发生的。就是说, 一个人,他可能别有用心也好,或什么的也好,他写一条,然后就可以用,你说以前没有 AI,他可以用,他得自己吭哧吭哧写,或者是找些人来吭哧吭哧写。现在有了 AI,他按一下就可以出 1000 条,出 10000 条。所以 AI 确实也给不好的事情赋能。

那这个情况下,我觉得首先作为个体,作为社会,我们得懂。我们每个人都会遇到这些事情,我们得懂。其实像我知道了这是AI写的,我就觉得很好玩,我还专门去看,AI还可以这样写。我就不伤心了。

但是说,严肃一点就是,第一,自身的教育很重要,群体的教育很重要。第二,就是制度和政策。 这个也是建立在认知之上的。就是说如果我们对这个工具的破坏性没有认知的话,它不光是假新闻了,那么,还有很多其他的破坏性。我没有认知,我们就永远不会找到更好的制度,或者更好的方式去deal with it。所以这个也非常重要。

第三,我就很赞同你在做的事情。就是说,工具就在这了,它带着好带着坏。那你作为一个媒体人, 你怎么去更新你自己的产品?你怎么通过你的智慧、你的执行力,让你的新的产品创造性,有特色? 所以,比如说我看你写的东西,我就会知道这肯定不是AI写的。或者是,他用AI的工具,但是他带给我很多有价值的东西。那这个又要靠我们人的创造性。所以确实是不容易。

我们每个人在AI的时代,有时候也是受害者,有时候也被冲击得很大。但是还是我刚才说的,我觉得责任在我们。就是说,怎么去用这工具,怎么不被这个工具伤害,怎么去让这个工具不去伤害别人,怎么把自己想做的事做好。所有的这些责任,还是人的责任。

赵何娟: 特别好。有很多年轻人都非常非常喜欢你。然后我也想,就是能够请您是不是能够,就当您跟16岁 刚开始在去求学路上的自己再说一句话的话,能不能给现在的青年人吧,说一些寄语?

李飞飞: 我觉得我特别,特别笨,说这句话,说这些话。给青少年的寄语。

我真心的觉得,这是一个非常非常了不起的时代。因为这个时代我们的科技在变更,我们的社会在变更。那么这个时代的青少年,是有很多很多机会的。但最终把握这个机会的是你们自己。你怎么去带着你的好奇心,带着你的,在我书里提到的北极星,心里的那种激情,那种信仰,那种追求去,去做你自己,然后去改变世界。我觉得这还是,这个时代给你的最大的一个机会。也希望这些小朋友们,青少年们意识到这个机会,给自己这个机会去,就努力去做呗。

赵何娟: 好,谢谢飞飞教授。今天对话的最后,我也想用你的一句话来结尾,就是希望人类永远不要自我放弃。

再次谢谢飞飞教授。真的是百忙之中,能够跟我们做一次这样的交流和对话,特别感谢。

李飞飞: 谢谢。


    24小时新闻排行榜更多>>
  1. 忆小时候与六弟度过的幸福时光
  2. 非洲惊现大量中国“小电驴” 中共获巨大利益
  3. 你退回的Costco商品后来去哪了?
  4. 普京喊话吕特:为何执意要跟我们打仗?
  5. 美议员呼吁将DeepSeek、小米等列入“涉军企业”清单
  6. 林彪3次“救驾”毛使出“看家法宝”扭脸不认帐
  7. 爱泼斯坦案相片 安德鲁躺5女腿上 在王室庄园拍摄
  8. 明居正谈跨境镇压 中共攻击手法曝光
  9. 中国民众反日情绪难化解
  10. 宁波女婴小洛熙尸检报告出炉 手术存在重大失误
  11. 能效提升10倍,摩尔线程发布“花港”GPU架构
  12. 周润发请近百名TVB旧同事聚餐
  13. 美官员:美在委内瑞拉海岸附近扣押一艘船
  14. 俄“彼得大帝”号巡洋舰,全长超250米
  15. 红色渗透就是不怕玩火
  16. 山巅之光与公牛 梅诺卡岛蒙特托罗山的古老传说
  17. 美签署法案直击中共七寸 习近平财富将被曝光
  18. 爱泼斯坦案文件出现多名权贵人物
  19. 又一起!中国籍博士后被控向美走私大肠杆菌
  20. 毅力号火星车完成自主长距离行驶
  21. 巨型吊牌成电商“防退货”标配
  22. 如果人民币开始持续升值
  23. 迈克尔杰克逊...爱泼斯坦档案及照片涉及哪些名人
  24. 美军再扣委内瑞拉油轮 海格塞斯强硬表态
  25. 中国深空探测为何离不开“它”?
  26. 美议员指法国阻止披露空客在华业务 涉中国军方利益
  27. 日本与中亚五国家达新合作倡议 含关键矿产
  28. 印度尼西亚——巴厘岛乌布
  29. BC驾照大改:N牌司机明年起免路考升级
  30. 楚王珍藏的“长霝”长啥样?
  31. 波兰总统当面向泽连斯基“发难”
  32. 欧盟援乌,全是戏精与算计
  33. 中产阶级眼中7样“好东西” 为何富人不买
  34. 急下架16份淫魔档案:裸女图被消失
  35. 中国11月稀土出口创新高
  36. 大法官不挺!必税案将宣判“川普败诉机率偏高”
  37. 印度股市,为什么今年就不行了?
  38. 【翻墙必看】分析:川普又令中共跳脚
  39. 印度大坝突然放水,巴基斯坦怒了
  40. 女子盗用按摩师身份打工,本人慌了
  41. 酒店住宿时,别犯这些致命安全错误
  42. 泰军方:已初步控制边境一处关键高地
  43. 布朗大学枪击案嫌犯曾在葡萄牙从事IT工作
  44. 石涛高清小品108幅,一饱眼福
  45. 回收平台藏猫腻:预估4500,到手砍1500
  46. 迈阿密会谈前,俄外长警告欧洲“别碍事”
  47. 张文父母得“变卖家产”赔偿?
  48. 最新谈判 美俄佛州对话登场 普京“毫不让步”
  49. 台湾和大陆 到底谁该“统一”谁?
  50. 冬至撞天赦日!命理师曝光:老天会收一波人走
  51. 川普政府正解雇一批由拜登任命的职业外交官
  52. 谷歌苹果警告持美签员工避免国际旅行
  53. 【重播】美运输安全委员会就北卡坠机举行记者会
  54. 中国正转为零工经济国 意味着什么
  55. 日本官员叫嚣“拥核”,俄方表态
  56. 重庆师大团队:用数学公式治理城市交通
  57. 加州女子遥控全球恐攻,获刑30年
  58. 一纸判决,千亿回归
  59. 美司法部再公开两批爱泼斯坦案文件,超550页被涂黑
  60. 美军大规模空袭报复IS,轰毙5名成员