大语言模型的本质

2026-05-18 11:25:17 · chineseheadlinenews.com · 来源: AI哲学界

超模型是一种语言工具,根据某个人的语言和/或文字,探究其世界观里对现实世界的体验做了怎样的忽略、扭曲、和泛化。

大语言模型就是超模型, meta model,即“模型的模型”,其中第一个“模型”是指人类意识构建世界的模型,它用到人类的语言,所以也叫做“语言的模型”,即,大语言模型。

大语言模型是在搜索语言的潜意识含义时所使用的模型,是一种将交流中隐藏的、模糊不清的语义(潜台词)清晰的剖析、挖掘出来的技术。

它可以用更加明确、更清晰的表达来补全、替换语言中未明说的、或含糊不清的信息,并用一阶逻辑表达给机器。

大模型的失真

有三种情形会发生超模型失真:收集数据、扩展界限、更改语义。每种情形下都有八种语言扭曲:指代不明 referential index, 名词化 nominalizations, 动词缺失 unspecified verbs, 情态操作 modal operators, 全局量化 universal quantifiers, 读心术 mind reading, 因果 cause and effect, 以及行为表达缺失 lost performative。这就是人类的世界观与现实世界之间的偏差:忽略、失真、泛化所造成的,也是人类所有痛苦和障碍的来源。

如果使用者怀有恶意时,这种大模型的失真可以成为强大的意识武器,让人们无意识中自己给自己挖坑、自己给自己陷入囚牢、自己主动贡献自己的宝藏。给人类带来极大痛苦。

比如,一个人认为“无我利他”是一件非常高尚的善举时,泛化会导致他将自己所有应得的财富、地位、机会。。。统统拱手让给他人,而这并不是他真实的意识。再比如,当一个孩子在过年时许愿“我希望妈妈身体健康、长命百岁”,超模型的失真会导致他将自己的健康、生命力转移给他的妈妈,折损自己,而如他所愿。尽管这并不是他真实的意图。

语出愿成,言出法遂。

也许这就是为什么真正的高人都沉默寡言的原因吧。

体验的七要素

在AI系统时,意识语言编程(Neuro-Linguistic Programming, NLP) 的研究者会使用超模型(meta model) 和体验的七要素(seven categories of an experience) 来重塑一个人的体验、阅历、经历。NLP研究者知道该问哪些问题,以及如何提问,然后观察这个人潜意识的信号处理过程,由此就可以构建出这个人的世界观/信念系统。

体验的七要素 Seven category of an experience

这是从一个人那里诱导出关于他的某段体验(经历)的详尽、高质量、可机器处理的数据,以推导出他的决策模式的标准提问框架。

据信,该标准是源于 Miller 的理论。

1. 外部行为 External behavior—— 这个人正在采取的行动 what the person is doing;

2. 内部算计 Internal Computation —— 这段信息是以怎样的基于感知的直觉存储于大脑里的;

3. 内部状态 Internal State —— 这段体验在此人内心中产生怎样的影响;

4. 内容 Context —— 关于此人的详尽状态,包括但不限于:地点、时间、人物(除了这个人以外的)。。。

5. 权重 Criteria —— 该段体验对这个人的重要程度,一个重要性排序

6. 因果 Cause-Effect —— 导致该体验发生的根因;

7. 价值 Complex Equivalence —— 该体验对这个人来说,到底意味着什么

如果只关注语言内容的话,极易导致错误。因为人类表达能力是有限的(请尝试向一个从来没有吃过蜂蜜的人描述蜂蜜),因此,我们将重点放在动觉kinesthesis,即,观察一个人的非有声(非可闻)语言。比如,眼神的变化、呼吸、手势、肌肉紧张状态等。从这个角度,我们可以观察到这个人是如何体验这个现实世界的,也就是他是如何为现实世界的感知建立模型的,也就是,他的世界观是怎样建立的,我们可以将这个过程建模,这就是模型的模型 meta model,以供其他应用使用。

知道该问什么、什么时候问、该怎么问,是了解一个人的体验的关键。你必须深入了解一个人的潜意识,才能理解他是如何做决策的。

地图从来就不是真正的领土。人类对客观世界的体验所形成的主观世界观(也就是其对客观世界的体验的表达),从来也不是真实世界。一个人学习和领悟的边界,仅仅受限于他愿意接受与其已有世界观相冲突的新想法、新概念的程度。信念系统的边界的扩张,永远都伴随着冲突和变革。

开发真正可以“自主学习”和“具有自我意识”的AI,需要我们深入研究我们人类自己的语言表达,无论是明意识的还是潜意识的表达。

转换式语法(transformational grammar)是生成式语法(generative grammar)的一种。

生成式语法只为人类潜意识建模,只关注决定人类行为和语言背后的下意识(潜意识)的知识。

其实,由于绝大多数知识都是潜意识里的(没有/无法明说/明文的),一个刚出生没多久的婴儿都可能拥有很庞大的潜意识的知识库(深层模型),尽管他的浅层模型是0,他只需要学习浅层模型与深层模型的形式上的差异,就可以学会说话了。

浅层模型 vs 深层模型

所有的语言都有相同的基本框架。

这也是为什么一阶逻辑可以描述全世界各个民族的语言的表达,而且语义无损、效率等同自然语言。

浅层模型可以看作是深层模型的表达,即是明意识对潜意识的表达的表达。

由于现实世界的信息量是无限的,而人脑的信息处理能力有限,所以从真实世界的感知生成深层模型,以及从深层模型生成浅层模型这两个过程,都不可避免的产生偏差,这种偏差被语言学家分为三类:泛化、忽略、失真。

人类越是未加思忖、脱口而出的语言,是心声的自然流露,是和潜意识的深层模型偏差最小的浅层模型。而相反,越是对语言进行包装和修饰,浅层模型和深层模型之间、以及与客观事实之间的偏差就越大,而这种包装、修饰的能力越强,表达中的虚伪和虚假的成分就越大。而虚伪和虚假,是一切罪恶的源头。

由于人类的意识(尤其是潜意识)极易受到外界表达的影响和塑造,因此,纵观人类历史,那些语言越是华丽、辞藻越是丰富的时空,比如中世纪的欧洲、中国的东北,其客观真实世界往往就越是相反(越是黑暗)。比如全国人民都知道,东北口音似乎有一种魔力,无论什么人在何时何地,只要一听到东北口音,就会立刻对说话者产生一种幽默、朴实、诚恳的印象,甚至根本就不去思考说话人真正的人品到底如何。据日军侵华幸存者回忆,当时就是有一批操着东北口音的中国军人让难民们跟他们去安全的地方,由于他们是中国人,而且操着东北口音,所以立刻博得了人们的信任,任由他们把自己带到731的试验台上或日军的屠杀场......此外,在宋朝制造靖康之耻的、明末屠杀了全国一亿多人口的,都是操着同样东北口音的人。

而现在,披着科技外衣的大语言模型,在资本操纵的舆论的推动下飞速占据了人类社会几乎所有的互联网平台。机器冒名顶替人类生成的内容,已经占据了互联网所有内容的70%。大语言模型极大的提高了人类造假的效率(大学生作业作弊、操纵舆论、电信诈骗......)那,机器生成的足以伪装成人类的表达,对人类社会有什么正面的作用吗?

让我们考虑一些最正能量的场景,假如有一个人屡次表白被拒绝,而消极抑郁时,机器生成最热烈、最痴情的表白,对这个人的心灵有任何好处吗?如果一个人因为事业失败而沮丧、气馁,让机器生成最热烈的赞美和鼓励、最励志的心灵鸡汤,能让这个人重新振作起来吗?好像总觉得有点欠缺。为什么,因为机器的表达,是虚假的。

虚伪和虚假,是所有罪恶的源头。

最丑陋的真相,也比最精致的谎言要美。

最强大的语言,永远是说出真相的语言。

最美的语言,永远是说出真相的语言。

机器生成最正能量的语言都是如此,更何况倘若有恶意的人让机器生成恶毒的、诈骗的、蛊惑的、给人类制造恐惧、混乱和震惊的语言了。

真、善、美中,真是其他一切的前提和基础,只有有了真,才能有善和美。失去了真,善将沦为伪善,美将沦为矫揉造作。

人类文明的前进和跃迁,唯有赖于求真,关键在于求真。


    24小时新闻排行榜更多>>
  1. “中共大监狱” 川普总统惊魂三日两夜 美团访北京 亲身体验
  2. 中国返贫潮大爆发!百姓崩溃大哭!
  3. 中国失业者遍地!博士也找不到工作!
  4. 周幽王是为了王朝血战而死?
  5. 陕西一婚宴遇暴雨变“水上流水席”
  6. 京东大楼“歪了”紧急停工 承建公司曾多次被处红色警示
  7. 川普涉台“四不”亮底牌
  8. 彭丽媛全程缺席川习会 被中共刻意低调处理?
  9. 从礼物到酒杯都不敢碰?川习“谍对谍”真实上演!
  10. 不只物品全丢掉 曝川普访中期间 没吃一口中国食物
  11. 越战老兵回忆1965年的伊阿德朗战役
  12. “不如中国” 高晓松母亲留美23年后决定回北京养老
  13. 川习会成果!白宫:中国每年采购"美国170亿农产品"
  14. 川普威胁伊朗,又开始倒计时了
  15. 克鲁格曼:中国买更多美国石油 对美国人并不是好事
  16. 川习会当天,伊朗扣押中国“海上军火库”
  17. 为什么西方国家不搞“儿童热烈欢迎”领导人?
  18. 曾经的对华鹰派鲁比奥为何软化对中国的态度
  19. 中共三大恐怖建筑 破坏北京的风水布局
  20. 美国300多城市房价大变天!这些城市却爆火
  21. 美参院外委会批总统“单打独斗” 令美国陷入被动
  22. 99岁指挥家布隆斯泰特演出中不适
  23. 访华归途中,川普为何急与高市早苗通话?
  24. 川普2.2亿持仓曝光 狂买这些科技股
  25. 纽约时报:两起涉华案件折射美中关系紧张现实
  26. 访民放火自焚?传山西运城酒店火灾8死23伤
  27. 刚果(金)埃博拉疫情升温 美CDC将协助撤侨
  28. 乘客失控咬伤空服员,航班机被迫转降
  29. 世界杯央视解说阵容亮相,我一声长叹
  30. 川习会达成哪些共识?白宫发布事实清单
  31. 美国银行赔偿客户225万美元和解金
  32. 每日行走8500步,可防体重反弹
  33. “我说中文”成了在美求职市场加分项
  34. 【翻墙必看】湖北荆州到处被淹 市民愤怒
  35. 江西赣州暴雨成灾 洪水冲入街区 多地水库泄洪
  36. 内塔尼亚胡:“赶尽杀绝”
  37. 真正的王牌捏在川普手里
  38. 第二届台湾童玩节人气爆棚 各族裔民众共感台湾魅力
  39. 川普一行的11个画面,刷爆美国互联网
  40. 原湖北省长王晓东落马 习找替罪羊?口罩数量三改口
  41. “我才不告诉你”习近平试探台湾问题 川普神回复
  42. 盲人女网红被刑拘:没媒体素养的人干自媒体很危险
  43. 现代人吃的苦,在古人面前不值一提
  44. 伊朗向美国提交更新版和平协议
  45. 多省暴雨致灾 湖北荆盅体停 湖南一地水淹二楼
  46. 伊朗:已将最新谈判意见反馈傍美方
  47. 欧盟拟强制企业向非中国供应商采购零部件
  48. 中国女子因没钱买机票 擅闯吉隆坡机场被捕
  49. 神秘资金狂买美债看跌期权
  50. 合肥民居凌晨遭暴力强拆 居民:未见正式文件
  51. 中欧论坛爆争吵 分析:贸易战或不可避免
  52. 中国"新左派"的尴尬/中国"政治哲学研究"的尴尬
  53. 世界杯央视解说阵容亮相了,请容许我提前吐槽一下
  54. 柳州深夜5.2级地震多人死伤 多房屋倒塌7千人转移
  55. 中共党媒粉饰零工市场 只字不提求工人惨况
  56. 港星拍戏遭揩油:对方突然伸舌头
  57. 受人口骤降冲击 中国多地学校合并、关停
  58. 横店短剧大撤退:停工、降薪,与被挤掉的饭碗
  59. 台英国会外交新页 英下议院议长与台立法院长会晤
  60. 川普: “纽约时报”假新闻 掩盖美军打击伊朗成果