AI可信论坛亮点:合合信息分享视觉内容安全技术前沿 ...

打印 上一主题 下一主题

主题 1424|帖子 1424|积分 4272

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
媒介

在当今科技迅猛发展的时代,人工智能(AI)技术正以亘古未有的速率改变着我们的生存与工作方式。作为AI范畴的重要盛会,CSIG青年科学家集会AI可信论坛汇聚了众多青年科学家与业界精英,共同探讨AI技术的最新盼望、挑战与未来趋势。本次论坛的关注核心无疑落在了AI可信性这一核心议题上,旨在推动AI技术的健康发展,确保其在实际应用中的可靠性、安全性和可信度。
在这场聪明碰撞的盛宴中,合合信息进行了一场出色的分享。本次分享的亮点在于合合信息的视觉内容安全技术,这是一项在图像识别、窜改检测、人脸鉴伪等范畴具有突破性盼望的技术。凭借其深厚的技术积累和丰富的行业经验,展现了视觉内容安全技术的最新结果与未来发展方向,为各人带来了一场技术与聪明的双重盛宴。这次分享主要从视觉内容安全发展近况和视觉内容安全技术趋势预测两点睁开,下面我将对这场分享进行深入解读。
视觉内容安全发展近况

一、视觉内容安全发展近况概览

随着科技的飞速发展,视觉内容安全已成为当前信息安全范畴的重要议题。以下是对视觉内容安全发展近况的全面概览:

  • 视觉安全需求增多的配景

  • AI技术飞速发展导致伪造内轻易得:比年来,AI技术的迅猛进步使得伪造图像、视频等视觉内容变得愈发轻易。这不仅威胁到了信息的真实性,也对社会秩序和个人隐私构成了严肃挑战。
  • 黑灰产使用伪造内容引发社会问题:不法分子使用AI伪造技术制造虚假信息,进行网络诈骗、恶意流传等违法活动,严重扰乱了社会秩序,陵犯了公众长处。
  • 企业与政府对于视觉安全的刚性需求:面临日益严肃的视觉安全威胁,企业和政府对于加强视觉内容安全的需求愈发急迫。他们盼望通过技术本领有用识别并防范伪造内容,确保信息的真实性和安全性。


  • 视觉内容安全技术的细分
视觉内容安全技术主要可以分为两大类:自动辨别与被动辨别,它们各自采用了不同的技术本领来实现对视觉内容的掩护。

  • 自动辨别
自动辨别技术是一种防备性的安全措施,其核心在于通过数字水印等本领在视觉内容中嵌入特定的信息或标志。这些水印可以是可见的,也可以是不可见的,它们被计划为在不影响视觉内容正常使用的前提下,为内容提供额外的身份验证和版权掩护。当视觉内容被流传或使用时,通过检测这些水印,可以迅速识别出内容的泉源、真伪以及是否经过窜改,从而有用防止盗版和虚假信息的流传。

  • 被动辨别
与自动辨别相比,被动辨别技术则更多地依靠于对已经存在的视觉内容进行分析和检测。这类技术通常包括文件标志、分类方法以及检测分割法等多种本领。文件标志是通过在视觉内容中添加特定的标识符或标签来区分不同的内容,这有助于快速识别出特定泉源或范例的内容。分类方法则是根据视觉内容的特性对其进行分类和归档,以便于后续的分析和处理。而检测分割法则是对视觉内容进行过细的分割和检测,以识别出其中的伪造、窜改或虚假信息。这些技术共同构成了被动辨别技术的核心,为视觉内容的真实性验证和版权掩护提供了有力的支持。




  • 视觉内容安全企业产品概览

  • 国表里企业产品对比:在视觉内容安全范畴,国表里企业纷纷推出了各自的产品和服务。这些产品在技术特点、应用场景等方面存在差异,但都在为提拔视觉内容的安全性而积极。



二、合合内容安全系统详解

合合内容安全系统作为视觉内容安全范畴的佼佼者,以其先进的技术和全面的功能,为众多企业和机构提供了高效的内容安全保障。以下是该系统两大核心技术的详细介绍:

  • 通用窜改检测技术
技术原理与特点
合合内容安全系统的通用窜改检测技术基于先进的图像处理和人工智能技术,能够实现对证照、证书、票据、截图、扫描文档以及文档印章等多种范例图像的窜改检测。该技术采用通用类PS检测模子,具备低误检、高检出的特点,能够正确识别并定位图像中的窜改区域。此外,该技术还具备抗压缩能力,能够应对图像在传输和存储过程中可能发生的压缩,保持稳定的检测性能。
应用场景与效果展示
通用窜改检测技术已广泛应用于证券、保险、银行、零售等多个行业。在这些行业中,证照、条约、票据等文件的真实性至关重要。通过合合内容安全系统的通用窜改检测技术,企业可以快速正确地识别出被窜改的文件,有用防范欺诈和虚假交易等风险。同时,该技术还可以用于文档图像的窜改检测比赛,资助参赛队伍提拔窜改检测能力。在效果展示方面,合合信息已公开的测试结果表明,该系统在多个数据集上均取得了优秀的检测性能。


  • 人脸鉴伪检测技术
技术亮点与创新
合合内容安全系统的人脸鉴伪检测技术采用前沿的人工智能算法,能够实现对AIGC生产的人脸、人脸PS天生后贴图等多种伪造人脸的检测。该技术具备高正确率、低误检率的特点,能够正确识别出伪造的人脸图像,有用防范身份冒用和欺诈等风险。此外,该技术还具备强大的泛化能力,能够应对多种未知范例的伪造人脸攻击。
落地应用与案例分享
人脸鉴伪检测技术已应用于某央企标杆银行的业务流程中,用于检测业务办理过程中涉及的人脸图像是否真实有用。通过该技术,银行可以实现对客户身份的快速正确验证,有用防范身份冒用和欺诈等风险。同时,该技术还可以为其他金融机构提供雷同的服务,提拔整个金融行业的风险防范能力。在案例分享方面,合合信息已公开的测试结果表明,该系统在多家银行的实际应用中均取得了显著的效果,有用提拔了银行的风险防控水平。

三、文档图像窜改检测范畴动态

1. 干系比赛概述
比赛配景与目的
随着视觉内容安全需求的不绝增加,文档图像窜改检测技术在各个范畴中的重要性日益凸显。为了应对日益复杂的窜改本领,提拔检测技术的正确性和鲁棒性,比年来举行了多场文档图像窜改检测比赛。这些比赛旨在汇聚行业内的顶尖人才,共同探索和创新窜改检测技术,推动该范畴的快速发展。
参赛队伍与作品亮点
在各类文档图像窜改检测比赛中,参赛队伍来自全球的顶尖科研院校和科技公司。他们提交的作品在窜改区域定位、防止误判等方面体现出色,适配多种真实场景。例如,在2023年文档分析与识别国际集会(ICDAR)挑战赛中,合合信息技术团队提出的AI图像窜改检测方案在保持极低误检率的同时,能够正确识别并定位图片中文本的窜改行为,从而有用保障文本信息的真实性。该方案在窜改检测范畴具有显著的技术上风和创新性。

2. 公开数据集与性能评估标准
公开数据集
随着文档图像窜改检测技术的不绝发展,多个公开数据集相继发布,为研究人员提供了丰富的实验资源。这些数据集涵盖了多种窜改本领、场景和范例,有助于全面评估检测技术的性能。以下是一些重要的公开数据集:

  • CASIA系列:包括CASIAv1和CASIAv2等,较早发布的文档图像窜改检测数据集。
  • Coverage:2016年发布的数据集,专注于文档图像的窜改检测。
  • NIST:2016年发布的数据集,包含了多种窜改本领的图像。
  • In Wild:2018年发布的数据集,注意于自然场景下的文档图像窜改检测。
  • IMD2020:2020年发布的数据集,针对文档图像的窜改检测进行了深入研究。
此外,另有如T-SROIET-IC13DocTamperSTFDFCTMFD-VIED等数据集,它们涵盖了合成文档、合成场景文本、文档窜改等多种范例,为研究人员提供了更为丰富的实验资源。特殊是DocTamper数据集,在文档窜改检测范畴具有较高的着名度和影响力,文章提出的方法在其测试集上的IoU(交并比)最高可达0.89,展现了当前技术的先进水平。
性能评估
在文档图像窜改检测范畴,性能评估是权衡技术优劣的关键环节。以下是一些常用的性能评估指标:

  • IoU(交并比):用于权衡检测结果的正确性,即检测出的窜改区域与真实窜改区域的交集占并集的比例。IoU越高,表现检测结果越正确。
  • 召回率:在固定误检率下,检测出的真实窜改区域占所有真实窜改区域的比例。召回率越高,表现检测技术的漏检率越低。
  • F1分数:综合考虑了精确率和召回率的性能指标,用于权衡检测技术的整体性能。F1分数越高,表现检测技术的性能越好。

3.学术界系统Top结果

  • Top结果:在DocTamper数据测试集上,某些学术系统实现了IoU(交并比)的高分体现,最高可达0.89。
  • 亮点:这些系统通常采用先进的深度学习技术,如基于ViT(Vision Transformer)和DCT(离散余弦变换)的窜改检测方法,能够正确检测部分无痕窜改。通过频率感知头来弥补视觉特性不显著时的问题,并采用多视图迭代解码器(MID)来使用不同尺度的特性信息,提高了检测的正确性和鲁棒性。

4.近期比赛Top结果分析
ICDAR 23-DTT比赛

  • Top结果:在固定误检率下的召回率指标上,参赛的学术界系统取得了优秀成绩。
  • 亮点:这些系统针对文档图像窜改检测中的跨域泛化能力、截图和PDF等纯色配景图窜改检测、以及质量退化等问题进行了深入研究。通过提出新的算法和模子,如Texture Jitter(纹理抖动)等数据增广方法,以及学习和分析特性之间的差异来提高泛化能力,使得系统在面临未见过窜改范例时也能保持高性能。
全球AI攻防挑战赛-AI核身之金融场景凭据窜改检测

  • Top结果:在F1指标上,参赛的学术界系统同样取得了令人瞩目的成绩。
  • 亮点:这些系统针对金融场景中的凭据窜改检测问题进行了针对性研究。通过使用大模子技术、多模态信息融合等方法,提高了系统对伪造图像和天生式图像的鉴别能力。同时,这些系统还注意在实际应用场景中的落地效果,通过优化算法和模子布局,低沉了误检率和漏检率,提高了系统的实用性和可靠性。

四、范畴挑战及示例案例

视觉内容安全技术面临的挑战
视觉内容安全技术正面临着多重挑战,这些挑战限制了技术的广泛应用和效果。

  • 跨域泛化能力:在实际应用中,系统需要具备良好的跨域泛化能力,即能够在不同范畴和数据集上保持高性能。然而,当前的技术通常只能在特定场景和数据集上体现优秀,一旦遇到未见过的伪造本领或多样化的应用场景,检测精度就会大幅降落。
  • 窜改本领变革快:随着伪造技术的不绝进步,窜改本领日益多样化和复杂化,这使得现有的检测系统难以跟上节奏,维护本钱高昂。
  • 质量退化问题:图像在传输、压缩、存档等过程中可能会出现模糊、JPEG伪影、下采样等环境,这些质量退化问题会粉饰窜改痕迹,使得检测系统难以正确识别。
  • 检出精度与误检率矛盾:客户通常盼望检测系统能够既保持高检出率,又低沉误检率。然而,这两者在技术实现上通常存在矛盾,需要权衡取舍。

五、技术规范与标准近况


  • 视觉内容安全技术规范与标准概述
为了推动视觉内容安全技术的规范化和标准化发展,行业内已经制定了一系列技术规范与标准。这些规范与标准旨在明白技术要求、测试方法、性能指标等方面,以确保检测系统的质量和可靠性。
在国内,中国信通院、合合信息、中国图象图形学学会等高校和公司团结编制了《文本图像窜改检测系统技术要求》等标准,为行业提供了有用的指引。这些标准涵盖了伪造图像鉴别、天生式图像鉴别等议题,凝结了行业共识。

  • 国表里技术规范与标准的对比与差异
国表里在视觉内容安全技术规范与标准方面存在肯定的差异。国内标准在制定过程中更注意实际应用场景和需求,夸大系统的实用性和可靠性。而国外标准则更注意技术的先进性和创新性,鼓励新技术的研发和应用。
此外,国内标准在测试方法和性能评估方面也更加完善,为检测系统的测试和评估提供了有力的支持。而国外标准则更注意系统的可表明性和透明度,要求系统能够清楚地表明检测结果和依据。

视觉内容安全技术趋势预测

一、内容安全系统未来需求方向

随着技术的不绝演进,视觉内容安全系统面临着日益复杂和多样化的挑战。在未来,内容安全系统的需求将主要会合在以下几个方面:
人脸伪造
随着AI换脸、照片活化等技术的不绝发展,人脸伪造的本领日益高超且难以察觉。这种伪造不仅可能用于娱乐或恶作剧,更可能被不法分子使用于身份认证、长途银行在线开户、资金划拨、贷款申请、名誉卡申请等场景,从而引发严重的社会问题。因此,对人脸伪造图像的检测将成为内容安全系统的重要需求之一。
图像窜改
图像窜改是指通过技术本领对图像进行修改或伪造,以到达欺骗或误导他人的目的。随着PS、AI生图等技术的遍及,图像窜改的本领越来越多样化,涉及的业务场景也越来越广泛,如身份证照造假、业务条约造假、资质证实造假、财务票据造假等。这些窜改不仅可能导致法律纠纷和信任危急,还可能对国家安全和社会稳定构成威胁。因此,对图像窜改的检测也是内容安全系统的重要需求之一。
声纹伪造
声纹伪造是指通过技术本领对语音进行合成或转换,以到达模仿或假冒他人的目的。随着语音合成、语音转换等技术的不绝发展,声纹伪造的本领也越来越高超。这种伪造可能被用于电话银行欺诈、APP资金划拨、伪造身份骗贷等场景,从而引发严重的安全问题。因此,对声纹伪造的检测也将成为内容安全系统的重要需求之一。

二、近期代表性研究与技术盼望

在视觉内容安全范畴,近期涌现了多项代表性研究与技术盼望,这些结果为提拔内容安全系统的性能和泛化能力提供了有力支持。
代表性研究

  • 基于ViT+DCT的窜改检测研究

  • 结果:在文档图像窜改检测方面,有研究者提出了基于ViT(Vision Transformer)和离散余弦变换(DCT)的窜改检测方法,该方法能够检测部分无痕窜改,并具有较高的检测精度。
  • 方法:该方法使用频率感知头来弥补视觉特性不显著时的问题,并采用多视图迭代解码器(MID)来使用不同尺度的特性信息,从而提拔检测效果。

  • 提拔Open-set中泛化能力的研究
  • 结果:在天生式AI时代配景下,有研究者提出了提拔场景文本窜改检测泛化能力的方法,该方法能够使系统在面临未见过的窜改本领时,仍能保持较高的检测性能。
  • 方法:该方法通过Texture Jitter(纹理抖动)技术增广练习数据,引导检测引擎关注纹理的非常,而非详细的窜改体现;同时,提出学习和分析特性之间的差异,而不仅是输入内容的特性的框架,以此提高对未见过窜改的检测性能。

技术盼望

  • 大模子技术在窜改检测中的应用

  • 盼望:随着大模子技术的不绝发展,有研究者开始探索将大模子应用于窜改检测任务中。例如,ForgeryGPT等模子通过结合小模子的初始窜改位置检测和大模子的自然语言表明能力,实现了对窜改区域的精确定位和表明。
  • 特点:大模子技术具有正确率高、使用便利、泛化能力优以及便于知识注入等上风,为窜改检测任务提供了新的办理思路。

  • 比赛与数据集推动技术进步

  • 盼望:比年来,多个与视觉内容安全干系的比赛和数据集相继发布,如ICDAR DTT、全球AI攻防挑战赛等。这些比赛和数据集不仅为研究者提供了测试和验证算法的平台,还推动了干系技术的进步和发展。
  • 贡献:通过到场比赛和使用公开数据集进行练习和优化,研究者能够不绝提拔算法的性能和泛化能力,从而推动视觉内容安全范畴的整体进步。
三、图像内容安全面临的主要挑战

图像内容安全在当前的技术环境和社会应用中面临着多重挑战,这些挑战不仅磨练着技术的先进性,也对系统的稳定性和顺应性提出了更高要求。以下是根据提供资料整理的图像内容安全面临的主要挑战:

  • 易受攻击性

  • 图像内容安全系统常常轻易受到各种形式的攻击,如缩放攻击,这种攻击可能会破坏图像中的关键特性,从而导致检测性能降落。
  • 在传输过程中,图像可能因压缩、格式转换等利用而遭受质量损失,进而影响窜改检测的正确性。

  • 泛化能力待提高

  • 只管在某些特定场景和数据集上,图像内容安全系统可能体现出色,但面临未知或多样化的伪造本领时,其检测性能通常无法保持较高水平。
  • 特殊是在open-set环境中,即测试会合包含练习会合未见过的样本时,系统的泛化能力成为了一个重大挑战。

  • 伪造本领变革快,维护本钱高

  • 随着技术的不绝发展,伪造图像的本领也在不绝更新和演变,这使得内容安全系统需要不绝升级和优化以应对新的挑战。
  • 然而,系统的维护和升级通常陪同着高昂的本钱,包括时间、人力和资源等方面的投入。

  • 数据获取与标注本钱高昂

  • 高质量的标注数据对于练习有用的图像内容安全系统至关重要。然而,获取和标注这些数据通常需要大量的人力和资源投入。
  • 此外,由于涉及到个人隐私和版权掩护等问题,数据的获取和标注过程可能更加复杂和困难。
四、基于大模子技术的创新探索

在视觉内容安全范畴,基于大模子技术的创新探索正在成为一股重要的力量。随着大模子技术的不绝发展和成熟,其在视觉内容安全方面的应用潜力渐渐显现。
大模子技术以其高正确率、强泛化能力和多模态信息处理能力,为视觉内容安全提供了新的办理方案。传统的视觉内容安全技术通常基于中小模子,轻易受到攻击,且泛化能力有限。而大模子技术则可以通过学习更丰富的特性和模式,提高检测的正确性和稳定性。同时,大模子还可以处理多模态信息,如图像、文本、语音等,从而实现对视觉内容更全面的理解和分析。
基于大模子的视觉内容安全技术还可以实现更高效的知识注入和迭代更新。传统的视觉内容安全技术需要手动更新和调整模子,以顺应新的伪造本领和场景。而大模子技术则可以通过交互方式,将新的知识注入到模子中,实现更快捷的迭代更新。这不仅低沉了维护本钱,还提高了系统的顺应性和灵活性。
在探索基于大模子的视觉内容安全技术时,一些代表性工作值得关注。例如,ForgeryGPT等模子已经开始尝试将大模子能力应用于伪造图像检测中。这些模子通过结合小模子的开端检测结果和大模子的自然语言表明能力,可以实现对窜改区域的正确定位和表明。这不仅提高了检测的正确性,还增强了系统的可表明性和可信度。

总结

视觉内容安全技术作为信息安全范畴的重要组成部分,其发展与挑战并存。未来,还需要不绝加强技术研发与规范制定,以应对日益复杂的挑战,确保视觉内容的真实性与安全性。
继续阅读请点击广告
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

光之使者

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表