3大AI模型PK:Grok 3“地表最聪明”?

2025-02-18 12:25:09 · chineseheadlinenews.com · 来源: 中央社

亿万富豪马斯克旗下人工智慧(AI)新创公司xAI今天推出标榜“地表最聪明AI”的聊天机器人Grok 3,投入比前一代多10倍以上的算力进行训练,具备思考及推理能力,直接挑战OpenAI、DeepSeek的模型。

DeepSeek横空出世,引起AI业界热议,原来低成本也可以训练出高效率的模型,未必需要砸大钱投资。去年9月OpenAI发表o1模型,透过推理和思考过程,减少“幻觉”产生;今年1月DeepSeek R1模型亮相,同样具备推理与思考能力,现在xAI的Grok 3也跟上脚步。

Grok 3目标理解宇宙 可自我反思修正错误

xAI今天在社交媒体X举行产品发表会直播,马斯克(Elon Musk)亲自参与。开发团队表示,Grok的目标是为了理解宇宙,Grok 3在传统AI测试和Chatbot Arena测试都拿到最高分,击败OpenAI、Google、DeepSeek的模型。

xAI团队指出,在训练Grok 3的过程中,必须克服散热及电力等挑战,团队在第一阶段用122天让10万颗绘图处理器(GPU)同时运作及训练,第二阶段用92天扩展到20万颗GPU。开发团队也在现场示范Grok 3撰写特别版“俄罗斯方块”游戏,并展示思考过程。

Grok 3除了标准版之外,还会陆续推出轻量化模型Grok 3 mini,以及用于推理的模型Grok 3 Reasoning、Grok 3 mini Reasoning。Grok 3进行推理时,会把复杂问题拆解成较小的步骤,自行检查是否发生错误并修正,适合用在数学、科学和程式设计相关领域。

xAI开发团队说,Grok 3将支援语音操作,未来数个月内会推出稳定版本。另外也预计加入DeepSearch功能,可以上网搜寻及汇整资料,再回应用户问题。

Grok 3宣传图。翻摄自马斯克X

价格方面,X平台的Premium+订阅方案会员,从今天起可以抢先试用Grok 3。Premium+订阅月费为22美元(约新台币721元),年费229美元(约新台币7500元)。

ChatGPT引领AI风潮 自然语言处理表现卓越

OpenAI推出的ChatGPT是引领这波AI风潮的先驱,可应用于生成文字、图像辨识等领域。最新版模型GPT-4的参数量提升到1750亿个,自然语言理解能力明显改善,但运算成本较高。GPT-4的优化版本为GPT-4o,参数量仅50亿个,针对特定应用场景设计,可提供更快的回应速度。

目前ChatGPT免费版的预设模型为GPT-4o,若免费额度用完会切换到较旧模型GPT-3.5。付费版无使用次数限制,在尖峰时段也能快速回应,并支援多模态(multimodal,指多种资料型态)处理能力,例如影像和语音辨识。

ChatGPT Plus付费版月费20美元(约新台币654元),可有限存取o1和o1-mini功能;Pro付费版月费200美元(约新台币6540元),除了能无限制存取4o和o1模型之外,还可存取包高阶的o1-Pro模型,以更多算力解答医学研究、法律分析等困难问题。

DeepSeek采开源模式 成本效益更高

中国AI新创公司“深度求索”(DeepSeek)去年12月推出开源模型DeepSeek-V3,具备6710亿个参数,但每次回答问题只会启动370亿个参数,借此优化运算资源,性能不仅超越其他开源模型,还胜过OpenAI的GPT-4o模型,尤其在数学、逻辑推理方面表现出色。

今年1月20日DeepSeek-R1模型问世,官方宣称训练成本只需要560万美元(约新台币1.83亿元),远低于业界训练类似规模的模型需花费数亿美元,动摇市场对AI产业“高成本等于高效能”的既有认知。

尽避DeepSeek展现低成本、高效能的潜力,但能否在商业化应用上真正挑战OpenAI和Google,仍需进一步观察。现阶段DeepSeek主要应用于特定场景,并未全面取代GPT-4的整体效能,况且开源模型能否普及,也面临数据品质、技术整合、产业落地等挑战。

DeepSeek目前可以免费在手机和电脑上使用。不少中国入口网站和通讯软体都开始串接DeepSeek,例如腾讯旗下微信正在测试导入DeepSeek模型,以改善内容搜寻品质;百度也宣布旗下搜寻业务全面导入DeepSeek。

不过,韩国17日才以个资保护等安全问题,下架DeepSeek,台湾公部门也持续禁用DeepSeek,显见中国开发的AI模型对各国而言仍有资安等疑虑。


    24小时新闻排行榜更多>>
  1. 一件善举让老人延寿十二年
  2. 加油成本大涨!美国人的“加油噩梦”卷土重来
  3. 中国四款纯椰子水被欧洲机构检测出掺假
  4. 日经指数低开1.7%,韩国综指低开2.8%
  5. 流感引发器官衰竭被迫截肢
  6. 中共推贷款成本透明化 分析:为甩锅做准备
  7. 路面坑洞催生换胎生意 修车工一晚进账2200元
  8. 伊朗战事引通胀忧虑 多国央行政策趋强硬
  9. 北京老人在银行忽悠下买200万元基金 亏85万
  10. 川普盟友警告:美国经济扛不住$100油价
  11. 美高官因反对伊朗战争辞职,万斯表态耐人寻味
  12. 美国情报首长:伊朗政权"仍然存在"但“已大幅削弱”
  13. 战争很可能发生 卢秀燕强调美国是维护台海和平重要战略伙伴
  14. 广东爆发大规模抗议 当局急调上千警力维稳
  15. 川普开战遭质疑,情报首长不愿“背书”
  16. 消息:伊朗新领袖穆杰塔巴并未真正掌权
  17. 遭两车意外夹击,路人踩出司机的生机
  18. 约旦河西岸暴行:巴勒斯坦男子遭定居者殴打,羞辱与性侵
  19. 叙利亚启动国际计划 销毁阿萨德遗留化武
  20. 海格塞斯:伊朗水面舰队不再构成威胁
  21. 张家港巡察组女官与丈夫被杀 消息遭封锁
  22. 传江苏张家港巡视组女官员和丈夫遭灭门
  23. “统一后”台湾人沦少数民族、台语被禁 国民党第一个被收拾
  24. 赫力昂加速拓展中国口腔护理市场
  25. 多地宣布:生物地理不再计入中考总分
  26. 玩极权:习近平像毛泽东还是更像他??
  27. 湖北开展涉芬太尼前体等化学品违法犯罪专项治理
  28. 美国务卿和防长住地上空发现不明无人机 或换住所
  29. 湖北两地抓翻墙网民 十余警察入户搜查引民愤
  30. 中国农民倒了什么血霉,被这样的人研究
  31. 西藏春耕仪式穿白衣挂习肖像 官媒视频急下架
  32. 高市早苗抵达美国 战战兢兢 就怕川普“不按牌理出牌”
  33. 拉里贾尼被“斩首”,细节披露
  34. 小粉红破防?2026华为翻车 民族脊梁碎一地
  35. 伊朗议会提案:对穿越霍尔木兹海峡船只征税
  36. 【重播】卡达尔首相与土耳其外长就伊朗问题开记者会
  37. 东北房价回暖,可能不只是房地产的故事
  38. 网上疯传“大蒜炝锅”致癌 是真的还是谣言?
  39. 中国首例:AI演员宣布出道
  40. 法拉盛4死火灾楼 邻居:这栋楼臭名昭著
  41. 分析:川普打伊朗 中共“大国”外宣坍塌
  42. 中国中产默默囤钱,或令全球经济失速
  43. 雷军官宣代言人:跟SU7同音
  44. 中国无人机大规模喷药失控:变成灭蜂行动
  45. 中外记者会一去不复返 说真话的总理也不在了
  46. 雷军官宣“神秘模型”
  47. 新型出轨,正在悄悄毁掉婚姻
  48. 耿爽任新职后首露面 习转变战狼外交 罢免四驻外大使
  49. 求生真的很难 林彪早写好了密信致毛泽东
  50. OpenAI新模型Day0就被嫌弃
  51. 哥斯达黎加拒绝承认古巴共产政权合法性
  52. Anthropic:你的电脑已被手机接管
  53. 加州海底捞机器人当众失控,酱汁飞满全场
  54. 七个美国盟友发表联合声明 支持霍尔木兹海峡通航计划
  55. 韩国矮化称“中国台湾”台湾这招反制全网赞爆
  56. 中国“名媛”落魄!男性集体清醒!
  57. 大强子对撞机发现新粒子
  58. 伊州副州长史特拉顿胜出
  59. 湖北一日两起翻墙处罚:一人罚200元一人罚500元
  60. 分析:中国电动汽车固态电池技术困难重重