3大AI模型PK:Grok 3“地表最聪明”?

2025-02-18 12:25:09 · chineseheadlinenews.com · 来源: 中央社

亿万富豪马斯克旗下人工智慧(AI)新创公司xAI今天推出标榜“地表最聪明AI”的聊天机器人Grok 3,投入比前一代多10倍以上的算力进行训练,具备思考及推理能力,直接挑战OpenAI、DeepSeek的模型。

DeepSeek横空出世,引起AI业界热议,原来低成本也可以训练出高效率的模型,未必需要砸大钱投资。去年9月OpenAI发表o1模型,透过推理和思考过程,减少“幻觉”产生;今年1月DeepSeek R1模型亮相,同样具备推理与思考能力,现在xAI的Grok 3也跟上脚步。

Grok 3目标理解宇宙 可自我反思修正错误

xAI今天在社交媒体X举行产品发表会直播,马斯克(Elon Musk)亲自参与。开发团队表示,Grok的目标是为了理解宇宙,Grok 3在传统AI测试和Chatbot Arena测试都拿到最高分,击败OpenAI、Google、DeepSeek的模型。

xAI团队指出,在训练Grok 3的过程中,必须克服散热及电力等挑战,团队在第一阶段用122天让10万颗绘图处理器(GPU)同时运作及训练,第二阶段用92天扩展到20万颗GPU。开发团队也在现场示范Grok 3撰写特别版“俄罗斯方块”游戏,并展示思考过程。

Grok 3除了标准版之外,还会陆续推出轻量化模型Grok 3 mini,以及用于推理的模型Grok 3 Reasoning、Grok 3 mini Reasoning。Grok 3进行推理时,会把复杂问题拆解成较小的步骤,自行检查是否发生错误并修正,适合用在数学、科学和程式设计相关领域。

xAI开发团队说,Grok 3将支援语音操作,未来数个月内会推出稳定版本。另外也预计加入DeepSearch功能,可以上网搜寻及汇整资料,再回应用户问题。

Grok 3宣传图。翻摄自马斯克X

价格方面,X平台的Premium+订阅方案会员,从今天起可以抢先试用Grok 3。Premium+订阅月费为22美元(约新台币721元),年费229美元(约新台币7500元)。

ChatGPT引领AI风潮 自然语言处理表现卓越

OpenAI推出的ChatGPT是引领这波AI风潮的先驱,可应用于生成文字、图像辨识等领域。最新版模型GPT-4的参数量提升到1750亿个,自然语言理解能力明显改善,但运算成本较高。GPT-4的优化版本为GPT-4o,参数量仅50亿个,针对特定应用场景设计,可提供更快的回应速度。

目前ChatGPT免费版的预设模型为GPT-4o,若免费额度用完会切换到较旧模型GPT-3.5。付费版无使用次数限制,在尖峰时段也能快速回应,并支援多模态(multimodal,指多种资料型态)处理能力,例如影像和语音辨识。

ChatGPT Plus付费版月费20美元(约新台币654元),可有限存取o1和o1-mini功能;Pro付费版月费200美元(约新台币6540元),除了能无限制存取4o和o1模型之外,还可存取包高阶的o1-Pro模型,以更多算力解答医学研究、法律分析等困难问题。

DeepSeek采开源模式 成本效益更高

中国AI新创公司“深度求索”(DeepSeek)去年12月推出开源模型DeepSeek-V3,具备6710亿个参数,但每次回答问题只会启动370亿个参数,借此优化运算资源,性能不仅超越其他开源模型,还胜过OpenAI的GPT-4o模型,尤其在数学、逻辑推理方面表现出色。

今年1月20日DeepSeek-R1模型问世,官方宣称训练成本只需要560万美元(约新台币1.83亿元),远低于业界训练类似规模的模型需花费数亿美元,动摇市场对AI产业“高成本等于高效能”的既有认知。

尽避DeepSeek展现低成本、高效能的潜力,但能否在商业化应用上真正挑战OpenAI和Google,仍需进一步观察。现阶段DeepSeek主要应用于特定场景,并未全面取代GPT-4的整体效能,况且开源模型能否普及,也面临数据品质、技术整合、产业落地等挑战。

DeepSeek目前可以免费在手机和电脑上使用。不少中国入口网站和通讯软体都开始串接DeepSeek,例如腾讯旗下微信正在测试导入DeepSeek模型,以改善内容搜寻品质;百度也宣布旗下搜寻业务全面导入DeepSeek。

不过,韩国17日才以个资保护等安全问题,下架DeepSeek,台湾公部门也持续禁用DeepSeek,显见中国开发的AI模型对各国而言仍有资安等疑虑。


    24小时新闻排行榜更多>>
  1. 伊朗战事进入第6天 最新发展综述
  2. 英国首次回应:不会与美国并肩作战
  3. 李干杰未入政协打破贯例 中共权力博弈引关注
  4. 男士更年期来临,身体会有10表现
  5. 中共军费增幅和GDP目标均下调 释何信号
  6. 高盛“逆市看涨”:霍尔木兹海峡将在5天后恢复流通
  7. 美官员闭门会议承认:伊朗无人机比预想更难对付
  8. 法国二手手机市场爆发
  9. 英特尔涉嫌用中资晶片设备 美跨党派议员质疑
  10. UFO坠毁巴西?据称有红眼外星人遭捕获
  11. 两会看点:军费增幅,GDP目标,对台措辞与缺席高官
  12. 中共两会北京风声鹤唳 游客手机壳都要拆开看
  13. 伊朗通讯几乎瘫痪
  14. 内娱艺人涌向东南亚
  15. 美以瘫痪伊朗防空 台湾应加速构筑“台湾之盾”
  16. "和我有什么关系?":中国年轻人为何不再关注"两会"
  17. 韩国警告:芯片供应链面临“中断”风险
  18. 为何肠癌一发现就是晚期?
  19. Claude暴击OpenAI,250万人抛弃ChatGPT
  20. 哈梅内伊被斩首后 北京急令销毁神秘文件
  21. 伊朗一打仗,中国车企先“受伤”
  22. 大爷每年生日购入100克黄金,上涨后就卖出
  23. 凯恩:美军开始逐步深入伊朗发动袭击
  24. 伊朗:在波斯湾击中美国油轮
  25. 冲突第五天:伊朗1045人死,美军6人阵亡
  26. 这些人80岁时大脑仍然年轻:原因找到了
  27. 两会中共军方人大代表大减 首次未设副团长
  28. 两会期间 访民进京伸冤 信访局外人潮聚集
  29. 曝伊拉克或无法参加世界杯:领空关闭+难获签证
  30. 中国初创公司在美军动手前 就把 F-22的位置公开!
  31. 卢比奥喊出“松绑蒋介石”:跨越70年的战略隐喻
  32. 传统文化中幸福的来源考
  33. 拒绝川普不借基地,西班牙首相为何敢如此强硬?
  34. 民主刚果东部矿场坍塌 超过200人遇难
  35. 中国光缆项目引争议 智利准总统暂停权力交接
  36. 中国半导体大佬集体发文 举全国之力造自己的阿斯麦
  37. 分析:伊朗委国巨变 中国原油进口三重承压
  38. 博通27年AI芯片营收将破1000亿
  39. 川普正式提名凯文·沃什出任美联储主席
  40. 卢比奥挺土耳其:伊朗袭击“不可接受”
  41. 朱永官代表:警惕“农药鸡尾酒”效应
  42. 委内瑞拉临时总统会晤美内政部长 修订矿业法
  43. 萧敬腾夫妇被偶遇,丁克生活超潇洒
  44. “慈不掌兵、情不立事”后半句是什么?
  45. “成本颠覆战”开打!揭“消耗型战争”新时代
  46. 纽约州议会已提支持“富人税”决议案
  47. 中共两会前夕 北京“访民村”数百人遭遣返
  48. 中共两会首日 北京突降大雪大雾 市民:世界末日的感觉
  49. 中共两会风声鹤唳 北京派人24小时紧盯天桥
  50. 中国物业费越来越难收 收缴率连四年下滑
  51. 敲响警钟:三天内两孩子殒命水中
  52. 西雅图华大校园挺巴抗议 包括华裔在内33人遭起诉
  53. 士嘉堡谷仓大火,消防奋力扑救
  54. 20句中国式冷幽默,越读越有味
  55. 伊朗革命卫队宣称击沉美国油轮
  56. 分析:中东战火外溢 牵动中国经济民生
  57. 美军80年大招"鱼雷击沉军舰",伊朗:美国将无比后悔
  58. 风险和竞争加剧,中国押注科技以抵御美国压力
  59. 逾百代表缺席人大会议 大清洗致系统动荡?
  60. 高血压患者,少吃这6种蔬菜