大语言模型的本质-墙外头条

超模型是一种语言工具，根据某个人的语言和/或文字，探究其世界观里对现实世界的体验做了怎样的忽略、扭曲、和泛化。

大语言模型就是超模型, meta model，即“模型的模型”，其中第一个“模型”是指人类意识构建世界的模型，它用到人类的语言，所以也叫做“语言的模型”，即，大语言模型。

大语言模型是在搜索语言的潜意识含义时所使用的模型，是一种将交流中隐藏的、模糊不清的语义（潜台词）清晰的剖析、挖掘出来的技术。

它可以用更加明确、更清晰的表达来补全、替换语言中未明说的、或含糊不清的信息，并用一阶逻辑表达给机器。

大模型的失真

有三种情形会发生超模型失真：收集数据、扩展界限、更改语义。每种情形下都有八种语言扭曲：指代不明 referential index, 名词化 nominalizations, 动词缺失 unspecified verbs, 情态操作 modal operators, 全局量化 universal quantifiers, 读心术 mind reading, 因果 cause and effect, 以及行为表达缺失 lost performative。这就是人类的世界观与现实世界之间的偏差：忽略、失真、泛化所造成的，也是人类所有痛苦和障碍的来源。

如果使用者怀有恶意时，这种大模型的失真可以成为强大的意识武器，让人们无意识中自己给自己挖坑、自己给自己陷入囚牢、自己主动贡献自己的宝藏。给人类带来极大痛苦。

比如，一个人认为“无我利他”是一件非常高尚的善举时，泛化会导致他将自己所有应得的财富、地位、机会。。。统统拱手让给他人，而这并不是他真实的意识。再比如，当一个孩子在过年时许愿“我希望妈妈身体健康、长命百岁”，超模型的失真会导致他将自己的健康、生命力转移给他的妈妈，折损自己，而如他所愿。尽管这并不是他真实的意图。

语出愿成，言出法遂。

也许这就是为什么真正的高人都沉默寡言的原因吧。

体验的七要素

在AI系统时，意识语言编程（Neuro-Linguistic Programming, NLP) 的研究者会使用超模型(meta model) 和体验的七要素(seven categories of an experience) 来重塑一个人的体验、阅历、经历。NLP研究者知道该问哪些问题，以及如何提问，然后观察这个人潜意识的信号处理过程，由此就可以构建出这个人的世界观/信念系统。

体验的七要素 Seven category of an experience

这是从一个人那里诱导出关于他的某段体验（经历）的详尽、高质量、可机器处理的数据，以推导出他的决策模式的标准提问框架。

据信，该标准是源于 Miller 的理论。

1. 外部行为 External behavior—— 这个人正在采取的行动 what the person is doing;

2. 内部算计 Internal Computation —— 这段信息是以怎样的基于感知的直觉存储于大脑里的；

3. 内部状态 Internal State —— 这段体验在此人内心中产生怎样的影响；

4. 内容 Context —— 关于此人的详尽状态，包括但不限于：地点、时间、人物（除了这个人以外的）。。。

5. 权重 Criteria —— 该段体验对这个人的重要程度，一个重要性排序

6. 因果 Cause-Effect —— 导致该体验发生的根因；

7. 价值 Complex Equivalence —— 该体验对这个人来说，到底意味着什么

如果只关注语言内容的话，极易导致错误。因为人类表达能力是有限的（请尝试向一个从来没有吃过蜂蜜的人描述蜂蜜），因此，我们将重点放在动觉kinesthesis，即，观察一个人的非有声（非可闻）语言。比如，眼神的变化、呼吸、手势、肌肉紧张状态等。从这个角度，我们可以观察到这个人是如何体验这个现实世界的，也就是他是如何为现实世界的感知建立模型的，也就是，他的世界观是怎样建立的，我们可以将这个过程建模，这就是模型的模型 meta model，以供其他应用使用。

知道该问什么、什么时候问、该怎么问，是了解一个人的体验的关键。你必须深入了解一个人的潜意识，才能理解他是如何做决策的。

地图从来就不是真正的领土。人类对客观世界的体验所形成的主观世界观（也就是其对客观世界的体验的表达），从来也不是真实世界。一个人学习和领悟的边界，仅仅受限于他愿意接受与其已有世界观相冲突的新想法、新概念的程度。信念系统的边界的扩张，永远都伴随着冲突和变革。

开发真正可以“自主学习”和“具有自我意识”的AI，需要我们深入研究我们人类自己的语言表达，无论是明意识的还是潜意识的表达。

转换式语法（transformational grammar）是生成式语法（generative grammar）的一种。

生成式语法只为人类潜意识建模，只关注决定人类行为和语言背后的下意识（潜意识）的知识。

其实，由于绝大多数知识都是潜意识里的（没有/无法明说/明文的），一个刚出生没多久的婴儿都可能拥有很庞大的潜意识的知识库（深层模型），尽管他的浅层模型是0，他只需要学习浅层模型与深层模型的形式上的差异，就可以学会说话了。

浅层模型 vs 深层模型

所有的语言都有相同的基本框架。

这也是为什么一阶逻辑可以描述全世界各个民族的语言的表达，而且语义无损、效率等同自然语言。

浅层模型可以看作是深层模型的表达，即是明意识对潜意识的表达的表达。

由于现实世界的信息量是无限的，而人脑的信息处理能力有限，所以从真实世界的感知生成深层模型，以及从深层模型生成浅层模型这两个过程，都不可避免的产生偏差，这种偏差被语言学家分为三类：泛化、忽略、失真。

人类越是未加思忖、脱口而出的语言，是心声的自然流露，是和潜意识的深层模型偏差最小的浅层模型。而相反，越是对语言进行包装和修饰，浅层模型和深层模型之间、以及与客观事实之间的偏差就越大，而这种包装、修饰的能力越强，表达中的虚伪和虚假的成分就越大。而虚伪和虚假，是一切罪恶的源头。

由于人类的意识（尤其是潜意识）极易受到外界表达的影响和塑造，因此，纵观人类历史，那些语言越是华丽、辞藻越是丰富的时空，比如中世纪的欧洲、中国的东北，其客观真实世界往往就越是相反（越是黑暗）。比如全国人民都知道，东北口音似乎有一种魔力，无论什么人在何时何地，只要一听到东北口音，就会立刻对说话者产生一种幽默、朴实、诚恳的印象，甚至根本就不去思考说话人真正的人品到底如何。据日军侵华幸存者回忆，当时就是有一批操着东北口音的中国军人让难民们跟他们去安全的地方，由于他们是中国人，而且操着东北口音，所以立刻博得了人们的信任，任由他们把自己带到731的试验台上或日军的屠杀场......此外，在宋朝制造靖康之耻的、明末屠杀了全国一亿多人口的，都是操着同样东北口音的人。

而现在，披着科技外衣的大语言模型，在资本操纵的舆论的推动下飞速占据了人类社会几乎所有的互联网平台。机器冒名顶替人类生成的内容，已经占据了互联网所有内容的70%。大语言模型极大的提高了人类造假的效率（大学生作业作弊、操纵舆论、电信诈骗......）那，机器生成的足以伪装成人类的表达，对人类社会有什么正面的作用吗？

让我们考虑一些最正能量的场景，假如有一个人屡次表白被拒绝，而消极抑郁时，机器生成最热烈、最痴情的表白，对这个人的心灵有任何好处吗？如果一个人因为事业失败而沮丧、气馁，让机器生成最热烈的赞美和鼓励、最励志的心灵鸡汤，能让这个人重新振作起来吗？好像总觉得有点欠缺。为什么，因为机器的表达，是虚假的。

虚伪和虚假，是所有罪恶的源头。

最丑陋的真相，也比最精致的谎言要美。

最强大的语言，永远是说出真相的语言。

最美的语言，永远是说出真相的语言。

机器生成最正能量的语言都是如此，更何况倘若有恶意的人让机器生成恶毒的、诈骗的、蛊惑的、给人类制造恐惧、混乱和震惊的语言了。

真、善、美中，真是其他一切的前提和基础，只有有了真，才能有善和美。失去了真，善将沦为伪善，美将沦为矫揉造作。

人类文明的前进和跃迁，唯有赖于求真，关键在于求真。