中国电信AI技术突破保障高清流畅
2026-01-21 03:25:05 · chineseheadlinenews.com · 来源: 中国科学报
近日,中国电信人工智能研究院(TeleAI)发布一项最新科研成果——生成式视频压缩技术(Generative Video Compression - GVC)。该技术基于生成式AI的视觉先验能力,提取并传输视频中紧凑的感知特征与动态变化数据,在接收端依托大模型强大的生成能力,实时“推演”并重构出纹理逼真、细节还原的高保真视频。这项技术可将视频数据压缩率降低至0.02%,即便在海上、山区等网络信号极差的“盲区”,也能确保视频画面连贯、零卡顿、低延迟,彻底解决了弱网环境下视频传输“卡成PPT”的行业痛点。
生成式视频压缩技术由中国电信集团CTO、首席科学家、TeleAI院长李学龙教授带领科研团队以智传网(AI Flow)信容律为理论基础创新提出。其核心理念是“用计算,换带宽”,通过模型小型化、知识蒸馏和量化等技术提升计算效率,再在接收端通过多模态生成技术“脑补”复原画面。这不仅大幅降低了对网络吞吐量的依赖,更让消费级GPU也能实现毫秒级低延迟推理。无论网络环境如何波动,生成的视频流始终保持帧率稳定,拒绝画面撕裂与跳帧。
传统视频传输往往依赖 HEVC等视频编码技术。无论看视频网站还是刷短视频,传统技术力求保留每个像素的原始信息,却忽略了更核心的传输诉求:要么人眼能看得舒服,要么机器能准确识别。GVC则采用“感知+任务导向”模式,面向人类视觉,传输“画质感知”特征,确保人眼看到的画面始终清晰、自然、动作流畅;面向机器视觉,传输“语义有效”表示,确保关键信息不丢失。在权威数据集测试中,GVC 的极端压缩率可达 0.005 bpp(对应 0.02% 压缩率),且能保持优异的视觉质感与语义传递效果。这意味着在2G/3G级别的微弱带宽下,传统技术早已无法连接,而GVC依然能保持优异的视觉质感与丝滑的动态效果。
中国电信集团CTO、首席科学家、TeleAI院长李学龙教授谈到:“智传网(AI Flow)的信容律描述了大模型的本质规律和能力边界,通过数据压缩的方式可以衡量模型的知识密度,也就是智能能力。在AI时代,通信的本质已从单纯的数据传输进化为智能分发。GVC通过资源置换策略,实现了通信效率与感知质量的最优平衡。它标志着视频通信正从‘像素搬运’迈向‘语义生成’的新阶段。在这个阶段,带宽不再是流畅度的瓶颈,智能计算将确保每一帧画面的实时与连贯。”
在实际应用中,GVC 尤其适配带宽稀缺、资源受限的关键场景:无论是海事通信中依赖窄带卫星的视频传输、应急救援时带宽紧张的画面回传,还是低带宽移动网络下的远程视频监控与视频流转,甚至是车载设备、可穿戴设备等边缘终端的轻量化视频传输需求,它都能提供高效的解决方案。GVC不仅突破了视频压缩的技术极限,更重新定义了通信的本质,即只传输感知与决策所需的核心信息,为高效、自适应、智能化的下一代视频通信铺平了道路。