天生式 AI 敏捷发展的时代,面临着内容安全与体系构建的双重挑衅。一方面,基于虚伪图片所引发的欺诈变乱日益增多,给社会带来了严重的负面影响,因此,我们必须高度关注人工智能的安全性,办理人工智能发展过程中的各种安全挑衅,以实现人工智能的连续健康发展。另一方面,练习大模型过程中低质量或不精确的数据会严重影响模型的练习和性能,通过应用性能的智能文档处置惩罚,可以或许自动化数据清洗、格式转换和信息提取,为模型提供高质量的练习数据,推动天生式AI技术的发展。
在本文中,我们将回首来自合合信息的郭丰俊博士在第七届中国模式识别与盘算机视觉大会中关于图像内容安全和智能文档处置惩罚推动体系构建加速的思考与探索,并介绍在天生式 AI 时代下文档智能处置惩罚技术面临的挑衅和研究进展。
1. PRCV 2024
1.1 大会简介
克日,第七届中国模式识别与盘算机视觉大会 (The 7th Chinese Conference on Pattern Recognition and Computer Vision, PRCV 2024) 在乌鲁木齐成功举办。此次大会由中国自动化学会 (CAA)、中国图象图形学学会 (CSIG)、中国人工智能学会 (CAAI) 和中国盘算机学会 (CCF) 共同主理,由新疆大学承办,是国内顶级的模式识别和盘算机视觉范畴学术盛会。PRCV 2024 汇聚了国表里模式识别和盘算机视觉范畴的浩繁科研工作者及工业界同行,交换最新的理论研究结果与技术进展。
此次会议加强了模式识别和盘算机视觉范畴学术界和企业界进行深入的“产学研”交换与合作,从而进一步推动模式识别与盘算机视觉范畴的协同创新。
1.2 天生式 Al 时代的内容安全与体系构建加速
比年来,随着天生式人工智能 (Generative Artificial Intelligence, GAI) 技术的迅猛发展,基于虚伪图片所引发的欺诈变乱也日益增多,给社会带来了严重的负面影响。这些虚伪图像不但误导了公众的认知,还大概对个人、企业和社会造成经济损失和信托危机。因此,确保图像内容的安全性变得尤为重要。在盘算机视觉范畴,研究和发展可以或许识别和防范虚伪图像的技术,已成为一个紧迫的课题。随着天生伪造图像题目的日益突出,图像内容安全的研究将为掩护信息真实性和维护社会信托提供重要支持。
另一方面,智能文档处置惩罚体系基于自然语言处置惩罚 (Natuarl Language Processing, NLP) 和呆板学习 (Machine Learning, ML) 算法,可以或许自动理解、天生和转换文档内容,使得体系在处置惩罚大量文本信息时,可以或许实现快速分类、信息提取及内容天生,从而大幅降低人工干预的需求,资助研发职员加速大模型体系的构建和练习过程,推动天生式AI技术的发展。
合合信息图像算法研发总监郭丰俊博士在 PRCV 2024 上,受邀发表了题为《天生式AI时代的内容安全与体系构建加速》的演讲,分享了图像内容安全和智能文档处置惩罚推动体系构建加速方面的最新研究结果和应用实践,助力办理天生式 AI 时代的双重挑衅。
2. 天生式 AI
总结而言,鉴别模型和天生模型是两种不同的呆板学习方法。鉴别模型通过观测值猜测标签,而天生模型通过学习数据分布来天生新的观测值。
天生模型估计 p ( x ) p(x) p(x),即天生观测值 x x x 的概率。也就是说,天生模型旨在对观测值 x x x 进行建模,从所学分布中进行采样可以天生新的观测值。
2.3 天生模型的发展
除了更容易办理的上风之外,鉴别模型在实际题目中的应用也比天生模型更广泛。例如,可以或许猜测给定视网膜图像是否隐含青光眼迹象的模型对医疗范畴具有重要作用,但可以或许天生眼部图片的模型大概并无作用。
但随着越来越多的公司开始提供面向特定业务题目的天生服务,天生模型的应用范围正在快速扩展。例如,只需提供特定的主题材料,就可以通过 API 访问天生原创博客文章的服务,还可以天生在不同场景下的产物图像,或者编写与品牌和目标信息相匹配的社交媒体内容和广告文案。同时,天生式 AI 在游戏筹划和电影制作等行业也逐渐得到应用。
3. GAI 内容安全
在 PRCV 2024 上,合合信息主要分享了 AI 图像安全技术方案的重点技术,包括图像窜改检测和人脸伪造检测技术,以应对日益频发的恶意 P 图、天生式造假和等征象。
3.1 GAI 时代内容安全挑衅
随着天生式人工智能 (Generative Artificial Intelligence, GAI)技术的敏捷发展,伪造数据的数量和可定制性也日益增长,人们对技术革新带来的优美生活倍感期待的同时,也增长了对于人工智能安全题目的担心,例如,有诈骗分子通过天生窜改内容诱骗受害者,如何有用破解信息安全困难、保障内容安全成为当前的重要议题。
图像作为信息的主要载体之一,图像内容安全在盘算机视觉范畴的重要性日益突出。例如,在金融行业,银行移动开户、名誉卡申办和保险理赔等场景中,身份信息核查是银行、保险等业务场景中的首要项,利用 GAI 技术,攻击者可以快速天生虚伪的姓名、地址和电话号码等身份信息,这些窜改身份信息不但与真实信息相似,还可以根据特定需求进行调整,使得识别变得更加困难,为个人和企业带来巨大的资金损失与潜伏风险;同样,在汽车交易、运输等业务中,涉及大量驾驶证、行驶证真实性核查,利用 GAI 技术天生的证件在外观和细节上几乎无法与真实证件区分,这使得非法分子可以或许轻松利用这些窜改证件进行非法活动,行驶证涉及到车辆买卖正当性,行驶证造假与核查困难给相关企业造成了相当高的经济损失风险;再比如,在财政审批过程中,对网约车订单、付款截图、航空行程单、酒店流水等各类报销佐证单据的真实性检验是一项重要任务,企业在面对这些窜改票据时,往往难以识别,进一步增长了虚伪发票和收据天生带来的财政欺诈风险。
同时,合合信息积极参与学术界交换,在 2023 年文档分析与识别国际会议 (International Conference on Document Analysis and Recognition, ICDAR) 的挑衅赛中,得到了文档窜改检测技术竞赛的冠军,同时与中国信通院、中国图象图形学学会等机构联合发布了《文本图像窜改检测体系技术要求》团体标准,可以或许推动相关技术更好的落地应用。
在天生式 AI 时代,大模型的构建面临诸多挑衅和题目。其中,数据泉源和质量的限定成为大模型进一步提高性能的主要障碍。高质量、丰富多样的数据集对于模型的练习至关重要,但在某些范畴,合适的数据大概非常稀缺,从而影响模型的性能和公正性。别的,模型的复杂度和练习难度显著增长,往往导致开发和优化的过程变得及其繁琐。以上这些因素共同制约天生式 AI 的进一步发展和应用。
4.2 TextIn 大模型加速器
合合信息是一家深耕智能文字识别和商业大数据范畴的公司,主要的平台产物包括智能文字识别服务平台和商业大数据技术与资产平台,其中,智能文字识别服务平台 TextIn 提供高精准度的智能文字识别引擎及场景化产物,支持多种部署方式,提升文档处置惩罚流程的服从,例如光学字符识别 (Optical Character Recognition, OCR)、图像切边增强、PS 窜改检测以及图像改正等。
在天生式 AI 时代,模型具备快速响应用户需求的本领,可以或许实现即时天生与交互。但不精确数据会影响模型的体现,导致天生内容不可靠,同时随着陪同内容天生的便利,也出现了虚伪信息、版权题目等安全挑衅。本文通过回首郭博士在郭丰俊博士在第七届中国模式识别与盘算机视觉大会中的陈诉,介绍了合合信息关于文档和证件等数据的伪造检测技术,以及可以或许用于加速大模型体系的构建和练习过程的文档处置惩罚服务平台。