研究提出一种轻量级、语义感知的概念擦除框架
2026-07-01 20:25:11 · chineseheadlinenews.com · 来源: 中国科学报
近日,哈尔滨工业大学深圳校区教授杨云云团队在人工智能生成内容的研究成果被IEEE国际计算机视觉与模式识别会议(CVPR 2026)录用。
该成果提出一种轻量级、语义感知的概念擦除框架,在文本到图像扩散模型的概念精准擦除任务上显著超越现有方法,为AI生成内容的版权保护、隐私合规及安全治理提供了全新技术路径。
大规模文本到图像扩散模型在内容创作领域展现出强大的生成能力,但也带来版权侵权、隐私泄露和不当内容生成等安全隐患。为应对这些风险,学界提出“概念擦除”技术,即在不重新训练整个模型的前提下,从预训练模型中移除特定语义概念。
然而,现有概念擦除方法普遍面临两大核心挑战:一是擦除不彻底,模型仍可能通过语义近义词等途径生成目标概念的图像;二是语义选择性差,擦除操作在消除目标概念的同时,会严重损害无关概念的生成质量,导致模型整体效用大幅下降。如何在“精准擦除”与“无损保留”之间取得平衡,一直是困扰学界的难题。
针对这一挑战,研究团队提出了MapRoute框架,其核心包含Mapper模块与语义路由机制两大创新设计。
MapRoute在冻结的预训练文本编码器之后引入一组轻量级模块(Mapper),每个Mapper通过自监督与概念擦除两阶段训练,在精准消除目标概念的同时,对其他概念实现接近零失真的保留效果。
语义路由机制则是在推理阶段,系统计算输入文本嵌入与所有目标概念嵌入之间的余弦相似度,动态激活与当前输入最相关的Top-K个Mapper,并依次施加其映射变换,这种“按需激活”的模块化设计,既避免了不同Mapper之间的参数冲突,也保证了对无关语义的零干扰。
该框架具备轻量级、模块化与无损性的特点,为扩散模型安全治理提供高效解决方案,可广泛用于AI生成内容的版权保护、隐私合规与内容安全领域,为AI技术的合规部署奠定技术基础。