Salesforce高管:“幻觉”影响“可靠性”

2025-12-21 17:25:18 · chineseheadlinenews.com · 来源: 华尔街日报

Salesforce在实际应用中遇到了多项大模型技术挑战,当给大模型超过8个指令时,它会开始遗漏指令,这对需要精确处理的任务来说并不理想。此外,AI还会出现“漂移”现象,“当用户提出无关问题时,AI代理会失去对其主要目标的关注”。

企业软件巨头Salesforce高管承认,对大模型的信任度在过去一年中有所下降,该公司正在其主要AI产品Agentforce中减少对生成式AI的依赖,转而采用更多基础的“确定性”自动化技术来提高软件可靠性。

周一,据The Information报道,Salesforce产品营销高级副总裁Sanjna Parulekar表示:“我们所有人在一年前对大语言模型都更有信心。”该公司现在Agentforce中使用基于预定义指令的确定性自动化,而非完全依赖AI模型的推理和解释能力。

这一策略调整旨在解决大模型在处理精确任务时出现的“幻觉”等技术故障,确保关键业务流程每次都遵循完全相同的步骤。Salesforce网站现在强调Agentforce能够帮助“消除大模型固有的随机性”。

作为最具价值的软件公司之一,Salesforce对大模型的部分退让可能对数千家使用该技术的企业产生影响,目前Agentforce预计年收入将超过5亿美元。

技术可靠性挑战推动策略转变

Salesforce在实际应用中遇到了大模型的多项技术挑战。该公司Agentforce首席技术官Muralidhar Krishnaprasad指出,当给大模型超过8个指令时,它会开始遗漏指令,这对需要精确处理的任务来说并不理想。

家庭安防公司Vivint的经历印证了这些问题。该公司为250万客户使用Agentforce处理客户支持,但遇到了可靠性问题。例如,尽管给出了在每次互动结束时向客户发送满意度调查的指令,但Agentforce有时会因无法确定的原因不发送调查。

为解决这类问题,Vivint与Salesforce合作在Agentforce内设置了"确定性触发器",确保每次都能发送调查。使用这种基础自动化形式不仅降低了运营成本,也为客户提供了更低的价格。

应对AI"漂移"现象

Salesforce高管Phil Mui在10月的博客文章中描述了另一个关键挑战:AI“漂移”现象。据Mui介绍,该公司“最复杂的客户”在使用AI时遇到困难,“当用户提出无关问题时,AI代理会失去对其主要目标的关注”。

例如,被编程引导客户填写表格的AI聊天机器人在客户提出与表格无关的问题时会“失去焦点”。为解决这一问题,Salesforce开发了Agentforce Script系统,通过识别哪些任务可以由不使用大模型的"代理"处理来最小化大语言模型的"不可预测性"。

该系统目前处于测试阶段,旨在确保AI代理在面对偏离问题时仍能保持专注于核心任务。

实际应用中的调整与优化

在自身运营中,Salesforce也调整了对大模型的使用程度。尽管CEO Marc Benioff此前表示,部分依赖OpenAI大模型的Agentforce现在处理Salesforce大部分客户服务询问,使公司能够裁减约4000名客户服务人员,但该公司近期似乎减少了其客户服务代理对大模型的使用。

例如,上周该公司在回应Agentforce技术问题的协助请求时,显示了博客文章链接列表,而非询问更多信息或讨论可能的问题。这种响应方式类似于企业多年来使用基础聊天机器人处理客户或网站访客问题的方式。

Salesforce发言人表示,公司今年“完善了主题结构,加强了防护措施,提高了检索质量,并调整响应以更具体、更符合上下文、更符合真实客户需求”。该发言人称,帮助代理解决的客户问题比以往任何时候都多,预计在1月底结束的财年中,已解决对话数量将增长90%。

这一趋势反映了整个行业面临的挑战。本月早些时候,由企业AI初创公司Sierra提供支持的Gap Inc.聊天机器人回答了关于成人用品和纳粹德国的问题,凸显了大模型偏离预期用途的普遍性问题。


    24小时新闻排行榜更多>>
  1. 每天吃点猪油,有助控制体重和炎症?
  2. 最炸裂 习近平替身死了 2027中国换人?
  3. 从结账到美食广场 2026年Costco有哪些变化
  4. 震惊:郑州肿瘤医院一上午检查11人全部癌症晚期
  5. 川普对台军售策略转变 经乌战验证 可有效阻共军登陆
  6. 李飞飞:我信仰的是人类,不是AI
  7. 狂欢照曝光!14岁少女"被骗做性爱按摩",23岁被嫌太老
  8. 台积电发威!凤凰城房市畅旺 豪宅与现金买家成主力
  9. 川普金卡火了:上线几天就卖出13亿
  10. 张文去年4月起策划犯案,密集采购护具
  11. 黎智英:这位挑战中国底线的亿万富翁,付上了自由的代价
  12. 中美休战结束?美售台百亿军备,中方大抛美债
  13. 朝鲜警告:必须不惜一切代价制止日本的核野心
  14. 闪迪强势回归:两年营收或暴增76%
  15. 中共地方电视台陷困境 分析:财政供养模式崩塌
  16. 中共副部级官员尹建业落马
  17. 公然违背党宣传 转世灵童须经过大清制度
  18. 老房子“强制体检”,政府出手了
  19. “小洛熙”父母:个人隐私和就医记录遭泄漏
  20. 海南“封关”难自救 菜价高 工资低 普通人生活太艰辛
  21. 中国又下最后通牒!要日撤回"台湾有事",小泉防相冷回
  22. 【佳音时刻】公开中共高层财产 美法案击中北京命门
  23. 高盛:中国顶尖AI应用
  24. 冬至大如年 美味饺子的秘密与消寒雅趣
  25. 又酸又辣的“白人中药” 被不敢生病的年轻人捧红了
  26. 普京毫不让步!美俄佛州对话登场 小泽促美加压
  27. 羊吃人 房吃人 AI吃人…从西雅图看美国“士绅化”
  28. 送器官?医揭发后坠楼死 医院爆“楼顶直升机天天飞”
  29. 防随机攻击模仿风气 刑事局速逮3嫌涉恐吓
  30. 今日冬至:“中华谈吃第一人”笔下的饺子,讲究!
  31. 还能这么玩?川普:我能允许美国政府赔我10亿…
  32. 马克龙宣布法国将建造新一代航母
  33. 旧金山大停电 约13万居民受影响
  34. TVB视后晒家中新置圣诞树
  35. “闻屁味”能防痴呆,是真的?
  36. 墨西哥机长广播讨薪:不结清就不起飞
  37. 超越二元对立:从奥班视角重审俄乌战争的深层起因
  38. MAGA大会砲火四射 裂痕曝光 昔日同盟当众开撕…
  39. 南京博物馆风波 有些话不宜展开 马伯庸那句话说得很准
  40. 张文原始屠杀计划曝光 意外遭制止 一箱汽油弹误燃
  41. 波音提出排放豁免申请 以再出售35架777F货机
  42. 普京特使:美俄佛州会谈具有建设性
  43. 中国多地私人影院被曝推销有偿陪侍服务
  44. 如何防止蜥蜴进入你家?
  45. 美丽宁静的莱茵河左岸
  46. 遭咸猪手乱摸——印度美女演员线下被围堵猥亵
  47. 电动汽车购补恐成中国厂商“助力”
  48. 孙俪一件羽绒衣已穿15年 生活态度引热议
  49. 狂奔AGI,Claude年终封王
  50. "台湾有事"发言后 中国稀土反而大量流向日本
  51. 泽连斯基尖锐回绝普京
  52. 今年密西沙加和宾顿共有4722辆车被盗
  53. 泰国也要对柬埔寨去军事化?
  54. 【直播】转折点美国节年会 万斯和艾莉卡等出席
  55. 最受UC偏爱的大陆高中出炉
  56. 火地岛国家公园游览
  57. 时隔30年再看,她的极简风依旧封神
  58. 从"AI猪食"到"大模型旅鼠",2025年度热词背后的新商机
  59. 五大铁证:中共最早倡导“台独”
  60. 爱泼斯坦案新文件公布,克林顿怒了