CVPR 2026新增赛道:EgoCross

2026-02-25 08:25:15 · chineseheadlinenews.com · 来源: 量子位

EgoVis(Joint Egocentric Vision Workshop)是近年来全球第一视角视觉(Egocentric Vision)领域最具影响力的学术活动之一,已连续三年在CVPR期间联合举办,汇聚了来自全球顶级高校与研究机构的前沿成果与创新思想。作为连接第一视角理解、具身智能与多模态学习的重要平台,EgoVis持续推动egocentric视频理解、ego-exo关系建模、具身决策等方向的发展。

依托CVPR 2026 EgoVis Workshop,重磅推出EgoCross(Cross-Domain Egocentric Video QA)挑战赛,旨在推动多模态大语言模型(MLLMs)在跨域第一视角视频问答中的泛化能力与推理能力。

本次挑战赛为全球研究者提供了一个高标准、开放式的评测平台,鼓励探索更具鲁棒性与可迁移性的模型方法。本次挑战赛现已正式面向全球研究者开启报名!如果你致力于多模态大语言模型(MLLMs)、视频问答(VideoQA)或是第一人称视角(Egocentric Vision)智能的研究,诚邀关注并参与本次竞赛,共同推动第一人称智能理解的前沿发展。

一、大赛背景

当前的多模态大模型在日常场景的视频理解上已经取得了显著进展,但当它们面对未知、复杂、高度专业化的真实世界场景时,往往会面临严重的泛化瓶颈。

为了探索和突破这一极限,主办方推出了EgoCross Benchmark(AAAI 2026)。不同于以往局限于“炒菜”、“做家务”等日常数据集,EgoCross聚焦于高难度跨领域的第一视角视频,旨在全面评估模型在不同视觉和语义条件下的鲁棒性与零样本/少样本泛化能力。

二、大赛任务介绍

任务描述:给定一段来自全新领域的第一视角视频,参赛模型需要针对给定的问题,从4个选项中准确推理并选择正确答案(Multiple-choice VideoQA)。

为了全面考验模型的跨领域适应力,本次挑战赛精选了四大特色领域:

外科手术(Surgery) :要求精细的器械识别、手术阶段理解与手部交互推理。

工业装配(Industry) :侧重零部件识别、操作流程推理与工具使用逻辑。

极限运动(Extreme Sports) :包含高速第一视角运动、导航线索与时序预测。

动物视角(Animal Perspective) :涵盖物种线索、非人类运动模式与行为理解。

数据集共包含798个视频片段和957个QA对,全面覆盖识别、定位、预测和计数总共4大类任务的15个子任务。具体任务定义可参考论文。

三、双赛道设置,满足不同研究需求

本次挑战赛在Codabench平台分为两个赛道,参赛团队可根据自身的研究方向和计算资源选择参与:

赛道一:受限资源赛道(Source-Limited Track)

规则:参赛者仅能使用官方提供的基线模型和极少量的支持集(Support Set)进行微调或引导。

核心目标:测试跨域泛化能力并比较不同微调方法的效果。

评测入口:https://www.codabench.org/competitions/11279/

赛道二:开源赛道(Open-Source Track)

规则:对基础模型没有任何限制(鼓励使用各类开源或商业闭源模型进行测试),允许使用额外的训练数据(前提是不能人为针对目标领域进行特殊构造)。

核心目标:鼓励创新地利用更强大模型或算法提升跨域泛化能力。

评测入口:https://www.codabench.org/competitions/13868/

(注:当前官方提供的SFT-Qwen3VL基线模型在四大领域的平均准确率仅为0.4608,仍有巨大的提升空间等待各位研究者来突破!)

四、评测平台及指标

竞赛平台:挑战赛将在Codabench平台进行,两个赛道分别对应独立评测页面。

评测指标:模型在测试集上的Multiple-choice VideoQA准确率(Accuracy)作为主要排名依据(最终排名与评奖细则以各赛道官方页面说明为准)。

说明:成绩优异的团队将受邀按照EgoVis Workshop的投稿要求提交技术报告,并有机会在CVPR 2026 Workshop展示研究成果。

五、数据&基线

为了让参赛者能够无缝切入研发,组委会已开源全套流程代码与数据集:

官方主页:EgoCross Benchmark官网(https://egocross-benchmark.github.io/)

会议信息:CVPR 2026 EgoVis Workshop主页(https://egovis.github.io/cvpr26/#)

评测推理代码:EgoCrossCodes (GitHub) (https://github.com/MyUniverse0726/EgoCross)

训练微调代码:基于Qwen3VL-4B的EgoCross_SFT_qwen3vl4b (https://github.com/LiYu0524/EgoCross_SFT_qwen3vl4b)

六、重要日程(太平洋时间PT)

评测榜单状态:现已开放

评测榜单截止:2026年5月13日

技术报告提交截止:2026年5月20日

获奖通知:2026年5月27日

CVPR研讨会时间:2026年6月3日- 4日

七、组织者团队


    24小时新闻排行榜更多>>
  1. 张扣扣走了七年,他父亲的手机还在坐牢
  2. 不祥之兆 赤马年中国大年初五全国遍地起火
  3. 一篇报告点燃华尔街的AI恐慌,道指暴跌800点
  4. 张又侠被抓前后 内蒙古驻军高层密集变动
  5. 为什么你有气无力 原来你的压力象“巨石”
  6. 日本教授 人不会死 只是脱掉了肉体这件衣服
  7. 传张又侠被插管 从一个过来人看张又侠的生死局
  8. 赫伊森时隔4天更新社媒,转发了一张猴子的图片
  9. CIA发波斯语视频 招募伊朗线人
  10. 内幕:中共借党建整肃官场 要求官员站队
  11. 地震、熊患、犯罪:北京叙事中“危险”的日本
  12. 云南盈江连发两次地震 民众紧急避险
  13. AI条款之争升温 美国防部威胁终止Anthropic合同
  14. 心脏病发作与斩杀线
  15. “美国王子”的婚姻真相:争吵与坠机中走向终点
  16. 美国学者:自由进步主义正走向终结
  17. 一文读懂苹果2026年股东大会:库克不会退休?
  18. 美国华盛顿州发生持刀伤人事件 致4人死亡
  19. 美最高院:USPS享有豁免权 邮件没送到不用赔
  20. “东江浮尸”惨状震撼全港 中共高层冷血实录
  21. “肯定不会一辈子滑雪” 谷爱凌或考虑进入其他行业
  22. 2028年全球智力危机,中产的黄昏到来?
  23. 谷爱凌挨轰回击范斯 坦言已习惯成为政治出气包
  24. 中共军报罕见不提“习主席” 习不断给张、刘找罪名
  25. 16年未解之谜终揭晓 银河系中一场恒星吞噬事件浮出水面
  26. 川普政府考虑要求银行收集客户公民身份信息
  27. 护犊的妈 强硬的哥 零容忍的侄…王子丑闻撕裂英王室
  28. 暴雪后美东北逐步重回正轨 恢复供电与交通
  29. 穿透中共“数字铁幕” 美国务院将推出翻墙服务
  30. 中国多地“献忠”:海南大火、二广高速重大车祸
  31. 为何国民党能在台湾成功推行土改?
  32. 传浙江外卖员被两台救护车劫杀 死后“捐献7器官”
  33. 美最新民调:川普年纪愈大愈反复无常
  34. 多伦多市中心高楼跳伞引热议
  35. 川普15%新关税150天后到期 共和党人恐无力延长
  36. 许多回国朋友带回的消息出奇一致
  37. 美商务部官员证实:2个月英伟达H200对华销售为零
  38. 党媒发文能上能下直戳习 崔永元现身《翠湖》首映礼
  39. 【直播】川普2026年国情咨文
  40. 古人类学新发现重塑人类演化图景
  41. 加州:中国家庭孩童朝海狮丢沙石 全家被驱离海滩
  42. 开户要查护照?非公民自由开户的时代或要结束了
  43. 中共网军被曝大规模介入日本选举 专家解析
  44. 关税失利后,川普暗示出生公民权裁决也将不利
  45. 进厂打工没人要的机器人,全在外面接商演
  46. 帅气藏不住!荷兰最年轻“同志总理”宣誓就任
  47. 巴西遭暴雨袭击 至少25死43失踪
  48. 牛奶浇出“天价”草莓葡萄?
  49. 骚扰海狮 中国游客被圣地牙哥公园管理员驱逐
  50. 川普国情咨文仅提及中国1次 访华前明显克制
  51. 1949年,为何急于建国?
  52. “爱国教授”:我们正在目睹自由进步主义的终结
  53. 美国35岁“坚强寡妇”,被控毒杀亲夫
  54. 业绩史上最强,美股为何不买账?
  55. 同声传译:川普破纪录超长国情咨文都讲了什么
  56. 专家警告: 湿重积雪让铲雪行为更危险
  57. 宁古塔到底苦不苦?
  58. 一文读懂苹果2026年股东大会
  59. 民主党高层:川普今晚要讲很久
  60. 老话“女人三笑,福气难保”是哪三种笑?