3大AI模型PK:Grok 3“地表最聪明”?

2025-02-18 12:25:09 · chineseheadlinenews.com · 来源: 中央社

亿万富豪马斯克旗下人工智慧(AI)新创公司xAI今天推出标榜“地表最聪明AI”的聊天机器人Grok 3,投入比前一代多10倍以上的算力进行训练,具备思考及推理能力,直接挑战OpenAI、DeepSeek的模型。

DeepSeek横空出世,引起AI业界热议,原来低成本也可以训练出高效率的模型,未必需要砸大钱投资。去年9月OpenAI发表o1模型,透过推理和思考过程,减少“幻觉”产生;今年1月DeepSeek R1模型亮相,同样具备推理与思考能力,现在xAI的Grok 3也跟上脚步。

Grok 3目标理解宇宙 可自我反思修正错误

xAI今天在社交媒体X举行产品发表会直播,马斯克(Elon Musk)亲自参与。开发团队表示,Grok的目标是为了理解宇宙,Grok 3在传统AI测试和Chatbot Arena测试都拿到最高分,击败OpenAI、Google、DeepSeek的模型。

xAI团队指出,在训练Grok 3的过程中,必须克服散热及电力等挑战,团队在第一阶段用122天让10万颗绘图处理器(GPU)同时运作及训练,第二阶段用92天扩展到20万颗GPU。开发团队也在现场示范Grok 3撰写特别版“俄罗斯方块”游戏,并展示思考过程。

Grok 3除了标准版之外,还会陆续推出轻量化模型Grok 3 mini,以及用于推理的模型Grok 3 Reasoning、Grok 3 mini Reasoning。Grok 3进行推理时,会把复杂问题拆解成较小的步骤,自行检查是否发生错误并修正,适合用在数学、科学和程式设计相关领域。

xAI开发团队说,Grok 3将支援语音操作,未来数个月内会推出稳定版本。另外也预计加入DeepSearch功能,可以上网搜寻及汇整资料,再回应用户问题。

Grok 3宣传图。翻摄自马斯克X

价格方面,X平台的Premium+订阅方案会员,从今天起可以抢先试用Grok 3。Premium+订阅月费为22美元(约新台币721元),年费229美元(约新台币7500元)。

ChatGPT引领AI风潮 自然语言处理表现卓越

OpenAI推出的ChatGPT是引领这波AI风潮的先驱,可应用于生成文字、图像辨识等领域。最新版模型GPT-4的参数量提升到1750亿个,自然语言理解能力明显改善,但运算成本较高。GPT-4的优化版本为GPT-4o,参数量仅50亿个,针对特定应用场景设计,可提供更快的回应速度。

目前ChatGPT免费版的预设模型为GPT-4o,若免费额度用完会切换到较旧模型GPT-3.5。付费版无使用次数限制,在尖峰时段也能快速回应,并支援多模态(multimodal,指多种资料型态)处理能力,例如影像和语音辨识。

ChatGPT Plus付费版月费20美元(约新台币654元),可有限存取o1和o1-mini功能;Pro付费版月费200美元(约新台币6540元),除了能无限制存取4o和o1模型之外,还可存取包高阶的o1-Pro模型,以更多算力解答医学研究、法律分析等困难问题。

DeepSeek采开源模式 成本效益更高

中国AI新创公司“深度求索”(DeepSeek)去年12月推出开源模型DeepSeek-V3,具备6710亿个参数,但每次回答问题只会启动370亿个参数,借此优化运算资源,性能不仅超越其他开源模型,还胜过OpenAI的GPT-4o模型,尤其在数学、逻辑推理方面表现出色。

今年1月20日DeepSeek-R1模型问世,官方宣称训练成本只需要560万美元(约新台币1.83亿元),远低于业界训练类似规模的模型需花费数亿美元,动摇市场对AI产业“高成本等于高效能”的既有认知。

尽避DeepSeek展现低成本、高效能的潜力,但能否在商业化应用上真正挑战OpenAI和Google,仍需进一步观察。现阶段DeepSeek主要应用于特定场景,并未全面取代GPT-4的整体效能,况且开源模型能否普及,也面临数据品质、技术整合、产业落地等挑战。

DeepSeek目前可以免费在手机和电脑上使用。不少中国入口网站和通讯软体都开始串接DeepSeek,例如腾讯旗下微信正在测试导入DeepSeek模型,以改善内容搜寻品质;百度也宣布旗下搜寻业务全面导入DeepSeek。

不过,韩国17日才以个资保护等安全问题,下架DeepSeek,台湾公部门也持续禁用DeepSeek,显见中国开发的AI模型对各国而言仍有资安等疑虑。


    24小时新闻排行榜更多>>
  1. “临阵退缩”,川普留下5大悬念
  2. 中共军方首办高干班 习“夫妻店”再引关注
  3. 纽约时报:中国如何建立起规模庞大的天然气储备
  4. 虚报77亿,9.6亿投资凭空造,河南三地为何数据造假
  5. 我的同事“被AI炼化了”,被困在电脑成永生打工人
  6. 伊朗成史上首个击落第5代战机国家 究竟用哪款导弹?
  7. 智利破获窃铜走私案 9亿美元赃铜销往中国
  8. 中国为什么不怕被“断气”?
  9. 停火又悬了,这三点实在太诡异
  10. 伊朗每天限15艘船通过霍尔木兹海峡
  11. 德黑兰内部现裂痕 停火令强硬派怒火难平
  12. 哈萨克庭审19名抗议者 辩方驳“煽仇”指控
  13. 广州发生暴力强拆 黑衣人私闯民宅驱离村民
  14. 肿瘤患者吃辣椒,或有5变化
  15. 国会“秒散会” 共和党挡下限战案 民主党威胁弹劾
  16. 民国暗杀要案——大汉奸李士群之死
  17. 纽约时报:伊朗战争对经济的损害比想象的更严重
  18. 大陆20岁网红流浪柬埔寨 开直播揭内幕遭封杀
  19. 癌症患者吃红枣,或有5变化
  20. “TACO交易”赚钱方式曝光
  21. 中国籍研究人员坠亡和美国对中国间谍活动的担忧
  22. 基层青年困在考研考编死循环,走不出去也回不了头
  23. 本国船舶频遭扣押 巴拿马要求中共尊重主权
  24. TACO交易能赚大钱?外媒:千万别长期看空
  25. 中美在不同AI赛道上领先,但谁都可能最终超前
  26. 中东战事引原材料大涨 浙江纺织业面临关停
  27. 搞AI的UW博士也被遣返?
  28. 伊万卡罕见受访 一度泪崩 坦言这段经历极为沉重
  29. 大陆土地出让金暴跌 楼市国进民退藏风险
  30. 中国加强跨境数据监管,三大运营商同时收紧信号
  31. 土豆是肺癌隐藏元凶?
  32. 美伊停火两周之际 王毅访朝鲜有何算计
  33. 福建访民黄清英上访失联后死亡 警方不立案
  34. 审查无所不在:中国记者的现实风险
  35. “胖改”2年未见效 大陆永辉超市亏损扩大
  36. 涉向媒体泄密 前美陆军雇员被逮捕及起诉
  37. A股主要指数全线飘绿 沪深两市缩量3004亿
  38. 以军空袭致三名记者身亡
  39. 川普警告伊朗:和谈若破裂 战事将升级
  40. 石油巨头抗议:新加坡效仿谁扛得住?
  41. 川普“狂人策略”失控?停火之后 盟友比敌人更寒心
  42. 伊朗大使删文引猜测 美伊停火谈判生变数?
  43. “杭州六小龙第一股”来了
  44. 德意志银行:中国是赢家
  45. 前安徽高官姚玉舟被查 出身共青团系统
  46. 以色列空袭黎巴嫩,联合国强烈谴责
  47. 印第安纳州汽油使用税停征30天
  48. “疯子策略”还能吓住世界?川普重复尼克松实验失败
  49. 11分钟打完一场仗?“科幻电影般的战争”来了
  50. 霍尔木兹海峡,伊朗恐收不到“过路费”了
  51. 伊朗外交关系战略委员会主席死了,还能谈吗?
  52. 超级圣婴或致今明两年全球高温 影响全美降水
  53. 川普:美军驻留伊朗,违约就“开火”
  54. 伊朗日允许15艘船只通过海峡 超级油轮需缴200万美元
  55. 王朔谈猫、谈生死、谈AI:越活越“没什么可说”
  56. 加州惊爆“内鬼纵火” 卫生纸仓库被毁 波及5000万人供应
  57. OpenAI下调门槛,直指Anthropic
  58. 温家宝罕见现身背后:习近平在向党内“放信号”?
  59. 霍尔木兹海峡1天仅7艘船过关
  60. 抢救飞行员不单纯?恐为美军重大失败“烟幕弹”