当前位置: 首页 > 团体标准 > 综合团体标准 > T/ISC 0058-2024 文本图像篡改检测系统技术要求

T/ISC 0058-2024 文本图像篡改检测系统技术要求

收藏
  • 大小:1.91 MB
  • 语言:中文版
  • 格式:PDF文档
  • 类别:综合团体标准
  • 更新日期:2025-03-03
资源简介
ICS 35.240
L 60
团体标准
T/ISC 0058—2024
文本图像篡改检测系统技术要求
Standard for Text Image Tampering Detection System
2024-9-3 发布2024-10-3 实施
中国互联网协会发布

目次
前言...............................................................................................................................................................II
引言....................................................................................................................................................................1
1 范围....................................................................................................................................................................2
2 规范性引用文件............................................................................................................................................... 2
3 术语和定义....................................................................................................................................................... 2
3.1 文本图像Text Image.................................................................................................................................... 2
3.2 文本图像篡改Text Image Tampering...........................................................................................................2
3.3 文本图像篡改检测Text Image Tampering Detection.................................................................................. 2
3.4 物理篡改Physical Tampering....................................................................................................................... 2
3.5 数字篡改Digital Tampering..........................................................................................................................2
3.6 物理攻击Physical Attack.............................................................................................................................. 2
3.7 数字攻击Digital Attack................................................................................................................................3
3.8 准确率Accuracy........................................................................................................................................... 3
3.9 误检率False Positive Rate.............................................................................................................................3
3.10 召回率True Positive Rate or Recall............................................................................................................3
3.11 均值交并比mean Intersection over Union................................................................................................. 3
3.12 可交换图像文件格式Exchangeable image file format..............................................................................3
4 缩略语................................................................................................................................................................3
5 系统输入/输出信息.......................................................................................................................................... 3
5.1 系统输入信息................................................................................................................................................ 3
5.2 系统输出信息................................................................................................................................................ 5
6 文本图像篡改检测........................................................................................................................................... 6
6.1 文本图像篡改分类........................................................................................................................................ 6
6.2 文本图像篡改定位........................................................................................................................................ 7
7 测试数据集....................................................................................................................................................... 7
7.1 测试数据集的标注和格式............................................................................................................................. 7
7.2 测试数据集的难度和多样性......................................................................................................................... 8
7.3 数据集的公开性和可重复性......................................................................................................................... 9
8 应用丰富度....................................................................................................................................................... 9
8.1 类型完备度.................................................................................................................................................... 9
9 系统成熟度....................................................................................................................................................... 9
9.1 易用性.............................................................................................................................................................9
9.2 安全性...........................................................................................................................................................10
9.3 产品部署...................................................................................................................................................... 10
10 评价标准....................................................................................................................................................... 12
10.1 评价指标.................................................................................................................................................... 12
10.2 性能要求.................................................................................................................................................... 12
10.3 测评方法.................................................................................................................................................... 13
附录......................................................................................................................................................................14
T/ISC 0058—2024
II
前言
本文件按照GB 1.1—2020《标准化工作导则第1部分标准化文件的结构和起草规则》的规
定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。
本文件由中国互联网协会提出并归口。
本文件起草单位:
中国信息通信研究院、上海合合信息科技股份有限公司、中国图象图形学会、中国科学技术大
学、深圳大学、上海交通大学、华南理工大学、南开大学、北京智游网安科技有限公司、蚂蚁科技
集团股份有限公司。
本文件主要起草人:
王景尧、吴荻、李玮、郭丰俊、丁凯、宋宏宇、陆大公、金连文、谢洪涛、王裕鑫、李斌、李
昊东、金耀辉、薛洋、高学、胡梦婷、原国杰、刘健、张天翼、刘菁菁、唐佳伟、陈倩华、曹海啸、
冯艺卓、何梦醒、张家珲、常天恩。
T/ISC 0058—2024
1
引言
科技的发展使得图像逐渐成为重要的信息传递手段,人们逐渐将纸质文本以数字图像的形式进
行信息传递,给人们提供了方便的同时,也带来的了极大的安全隐患。
文本图像篡改指的是对包含文本内容的图像(如卡证、文档、截图等)进行篡改。目前,图像
篡改检测研究主要集中在检测自然图像中被篡改的物体。相比之下,文本图像篡改表现出不同的特
征,例如篡改主要集中在文本区域且篡改痕迹难以察觉等。这些特征为图像取证带来了新的挑战。
人们或通过图像编辑工具进行图像编辑,或以物理篡改更加低成本地进行图像篡改,以达到人
眼难以区分或人工智能机器难以辨认的目的。
文本图像篡改检测技术规范的目的是,为文本图像篡改检测技术的发展、应用和推广提供指导
和支持,以解决实际问题并确保技术的可靠性和有效性。建立文本图像篡改检测技术规范具有必要
性和重大意义。
T/ISC 0058—2024
2
文本图像篡改检测系统技术要求
1 范围
本文件规定了文本图像篡改检测系统的技术要求。
本文件适用于拍照证照、扫描证照、拍照文档、扫描文档、截图等五大类文本图像篡改检测系
统的设计与评估。
2 规范性引用文件
本文件无规范性引用文件。
3 术语和定义
下列术语和定义适用于本文件。
3.1 文本图像Text Image
文本图像是通过某种方式将纸质文本数字化而得到的以图像格式存储的数据,可供用户电子阅
读,可供计算机进行相应的信息处理。
3.2 文本图像篡改Text Image Tampering
文本图像篡改是对文本图像的字符(串)、文本行(列)、图像区域进行未经授权的修改或操纵,以
改变文本图像的内容、外观或含义的过程。
注:字符(串)包含符号、数字、字母、拼音音标、希腊字母、英文音标、简体中文、繁体中文、藏文、
英文或其它语言。图像区域包括文字,人像、图标等。仅修改图像呈现质量而不改变图像内容信息的操
作不属于文本图像篡改。
3.3 文本图像篡改检测Text Image Tampering Detection
文本图像篡改检测是对文本图像内的字符(串)、文本行(列)、图像区域进行检测并判别文本图像
是否存在篡改的过程(篡改手段详见附录13.1)。
注:字符(串)包含符号、数字、字母、拼音音标、希腊字母、英文音标、简体中文、繁体中文、藏文、
英文或其它语言。图像区域包括文字,人像、图标等。仅修改图像呈现质量而不改变图像内容信息的操
作不属于文本图像篡改。
3.4 物理篡改Physical Tampering
物理篡改是指直接在检测主体上进行篡改,再经过拍照或扫描等操作转为文本图像。
3.5 数字篡改Digital Tampering
数字图像篡改是指将纸质文本转为数字图像后再进行篡改活动。
3.6 物理攻击Physical Attack
物理攻击是指在生成文本图像之前,对主体进行干扰,从而造成文本图像篡改检测系统失灵。
T/ISC 0058—2024
3
3.7 数字攻击Digital Attack
数字攻击是指直接在文本图像上添加干扰,从而造成文本图像篡改检测系统失灵。
3.8 准确率Accuracy
在特定数据集中检测所有无篡改文本图像和篡改文本图像的准确程度的测量指标。
3.9 误检率False Positive Rate
在特定数据集中无篡改文本图像误检程度的测量指标。
3.10 召回率True Positive Rate or Recall
在特定数据集中检测篡改文本图像召回程度的测量指标,即检测篡改文本图像的准确程度的测量指标。
3.11 均值交并比mean Intersection over Union
在特定数据集中定位篡改区域像素级准确度的测量指标。
3.12 可交换图像文件格式Exchangeable image file format
记录数码照片的属性信息和拍摄数据。
4 缩略语
TP True Positive 真阳
TN True Negative 真阴
FP False Positive 假阳
FN False Negative 假阴
Acc Accuracy 准确率
FPR False Positive Rate 误检率
TPR/Recall True Positive Rate 召回率
IoU Intersection over Union 交并比
mIoU mean Intersection over Union 均值交并比
Exif Exchangeable image file format 记录数码照片的属性信息和拍摄数据
5 系统输入/输出信息
5.1 系统输入信息
文本图像输入应支持以下要求:
1、支持对包含但不限于JPG、PNG、BMP、TIFF、WEBP、单帧GIF格式等常见格式作为输入;
2、支持对包含但不限于PDF等不可编辑内容的常见格式转为文本图像;
3、可支持对视频进行抽帧并转为文本图像;
4、文本图像主体分辨率不小于64×64像素;
5、支持包含不同语言的文本图像作为输入;
6、支持原始图像输入,不需要对原始图像进行裁切。
5.1.1 文本图像获取方式
T/ISC 0058—2024
4
文本图像输入应支持拍照、扫描、截屏等常见文本图像获取方式。
检测系统应支持以下现象产生的文本图像。
5.1.1.1 拍照
对于拍照获取的文本图像,应支持以下要求:
1、应支持手机相机、单反相机等不同拍照设备获取的拍照图像;
2、应支持不同角度拍照获取的拍照图像;
3、应支持一定拍照距离拍照获取的拍照图像;
4、应支持光照强度过强或过暗条件下拍照获取的拍照图像;
5、应支持由拍照设备导致色彩失真的拍照图像;
6、应支持拍照获取的拍照图像内存在背景干扰;
7、应支持由拍照设备产生噪声的拍照图像;
8、应支持由拍照设备产生镜像翻转的拍照图像;
9、应支持存在透视的拍照图像;
10、应支持存在非检测内容遮挡的拍照图像;
11、应支持纸质文本存在弯曲或弯折的拍照图像。
5.1.1.2 扫描
对于扫描获取的文本图像,应支持以下要求:
1、应支持由扫描设备导致的色彩失真的扫描图像;
2、应支持由不同扫描设备生成的彩色扫描图像;
3、应支持由扫描设备的光源质量导致亮度不均匀的扫描图像;
4、应支持由扫描设备生成的低质量扫描图像;
5、应支持纸质文本存在弯曲或弯折的拍照图像;
6、应支持由拍照图像转为扫描文件的扫描图像;
7、应支持扫描时纸张摆放的角度倾斜导致图像倾斜的扫描图像;
5.1.1.3 截屏
对于截屏获取的文本图像,应支持以下要求:
1、应支持电子设备导致分辨率低、图像质量差的截屏图像;
2、应支持存在背景干扰的截屏图像;
T/ISC 0058—2024
5
3、应支持由其他主体遮挡导致待检测主体不完整的截屏图像;
4、应支持存在水平翻转或垂直翻转的截屏图像。
5.1.2 文本图像类型
文本图像输入应支持支持以下文本图像类型:
1、支持证件类型的文本图像;
2、支持文档类型的文本图像;
3、支持截图类型的文本图像;
单一类型的文本图像,文本图像应支持以下要求:
1、应支持不同国家的文本图像;
2、应支持不同语言的文本图像;
3、应兼容同一证件或文档类型下不同版本的文本图像。
以身份证件为例:
1、应支持不同国家不同格式的身份证;
2、应支持不同国家或同一国家的不同使用语言的身份证;
3、应支持不同版本的身份证,如居民身份证、临时身份证等。
5.2 系统输出信息
结果输出形式
1、输出结果宜采用JSON格式文件;
2、输出文档应包含图片类型,图片篡改检测结果、图片篡改检测结果可视化、篡改区域坐标及坐
标格式、篡改区域检测置信度等信息。输出文件参考样例如下:
表1 文本图像篡改分类与定位文档输出形式参考样例
JSON 文档说明
"type": "figure" 图片类型
"tamperScore": 0.008219 图片篡改检测结果
"image": "/9j/4AAQSkZJRgABAQAAAQABAAD/2" 图片篡改检测结果可视化
"exif": [ Exif 信息输出
"artist": [ "Lin"] 编辑者
"software":[ " Photoshop"] 编辑软件
"Datatime": [ "2023-07-21 09:11:54"]] 编辑时间
"DateTimeDigitized": [ "2023-07-21 图像写入时间
09:10:23"]]
"locations": [ 文本图像篡改区域检测结果
"points": [ 文本图像篡改区域定位坐标
T/ISC 0058—2024
6
[ 115.0, 左上角横坐标
364.6], 左上角纵坐标
[ 216.0, 右下角横坐标
277.0 ] ], 右下角纵坐标
"confidence": [ 0.99344], tamperType:[“”]] 置信度分数
6 文本图像篡改检测
6.1 文本图像篡改分类
文本图像篡改分类模型框架支持多种模型,包含但不限于单一文本图像篡改分类模型(如身份证文本图
像篡改分类模型),通用证件/文档/截图文本图像篡改分类模型,以及通用文本图像篡改分类模型。文
本图像篡改分类系统应支持对输入的文本图像做整体判断,检测文本图像是否存在篡改,应检测的内容
如下:
1、应支持字符(串)的篡改分类;
2、应支持文本行的篡改分类;
3、应支持图像区域的篡改分类。
分类指标:Acc、FPR、Recall,计算方法见10.1。性能要求见10.2。
检测内容可进一步划分。
6.1.1 证件篡改分类
证件文本图像篡改分类应支持以下内容:
1、应支持文字和数字内容篡改分类,包含但不限于时间、编码、身份信息等内容;
2、应支持图像区域篡改分类,包含但不限于人像、印章等内容;
3、应支持二维码、条形码篡改分类;
4、应支持字体和排版篡改分类。
6.1.2 文档篡改分类
文档文本图像篡改分类应支持以下内容:
1、应支持文字和数字内容的篡改分类;
2、应支持图像和图表的篡改分类;
6.1.3 截图篡改分类
截图文本图像篡改分类应支持以下内容:
1、应支持文字和数字内容的篡改分类;
2、应支持图像和图表的篡改分类;
T/ISC 0058—2024
7
6.2 文本图像篡改定位
文本图像篡改定位系统应支持以下功能:
1、支持图像是否为篡改分类;
2、支持图像篡改区域定位。
其中:
 分类指标为Acc、FPR、Recall,计算方法见10.1;
 定位的指标指标为mIoU,计算方法见10.1。
性能要求见10.2。
依据文本图像类型,检测内容可进一步划分。
6.2.1 证件篡改定位
证件文本图像篡改定位应支持以下内容:
1、应支持文字和数字内容篡改定位,包含但不限于时间、编码、身份信息等内容;
2、应支持图像区域篡改定位,包含但不限于人像、印章等内容;
3、应支持二维码、条形码篡改定位;
4、应支持字体和排版篡改定位。
6.2.2 文档篡改定位
文档文本图像篡改检测应支持以下内容:
1、应支持文字和数字内容的篡改定位;
2、应支持图像和图表的篡改定位;
6.2.3 截图篡改定位
截图文本图像篡改检测应支持以下内容:
1、应支持文字和数字内容的篡改定位;
2、应支持图像和图表的篡改定位。
7 测试数据集
7.1 测试数据集的标注和格式
数据集标注分为分类标签和定位标签两种:
1、分类标签支持:
A. 二值标签:一种通用的分类标注方式,将真实文本图像标注为值1,将篡改文本图标注为
值0。
T/ISC 0058—2024
8
B. 多标签:根据实际应用场景,如用户希望知道篡改文本图像使用了哪些篡改手段,可使用
多标签,以标注文本图像。对于真实文本图像,将无篡改类别标注为值1,其余标注为0。
对于篡改文本图像,将使用的篡改类别标注为值1,其余标注为值0。标注示例如下表:
表2 数据集多标签标注示例
文本图像无有篡改贴片篡改涂抹篡改
...
复制移动篡改拼接篡改
真实图像1 0 0 0 0
篡改图像0 1 0 1 0
2、定位标签:(应该和分类标签共同标注,分一级标签和二级标签)
A、应支持掩码:掩码是一个二值图像,与对应的文本图像具有相同的大小;文本图像中篡改
区域在掩码中对应的数值为1,未篡改区域对应的数值为0;(示例见附录10)
B、应支持边界框:用于描述篡改区域的位置,每一个篡改区域的位置由四个数值[x1,y1,x2,y2]
组成,分别表示篡改区域的左上角横坐标、左上角纵坐标、右下角横坐标和右下角纵坐标。
(示例见附录11)
7.2 测试数据集的难度和多样性
为了确保文本篡改检测技术能落地于应用场景中,数据集要求如下:
1、样本分辨率:数据集可包含大小不一的样本,图像主体分辨率最小为64×64像素。不设最大分
辨率;
2、背景复杂度:背景包含具有干扰信息,如文字、人像等;
3、遮挡:可遮挡图像中主体的部分区域,但不能完全遮挡;
4、光照变化:包含光照变化差异大的图像;
5、图像主体形变:包含应拍摄、扫描角度,或纸质文本存在弯曲或弯折,从而导致文本图像主体
形变的样本。
为了应对不同的应用场景,需确保数据集的多样性:
1、样本数量:数据集中包含的样本数量越多,涵盖的情况就越多,数据集的多样性就越高。
2、样本类别:数据集中包含的样本类别越多,涵盖的情况就越多,数据集的多样性就越高。例如,
数据集可包含现存的所有篡改类型的样本。
3、样本变化:数据集中包含的样本变化越多,涵盖的情况就越多,数据集的多样性就越高。例如,
文本图像获取方式,文本图文类型,光照和色彩变化,图片背景变化等。
T/ISC 0058—2024
9
4、样本来源:数据集中包含的样本来源越多,涵盖的情况就越多,数据集的多样性就越高。例如,
从公开数据集获取样本,从合成应用工具生成数据等。
7.3 数据集的公开性和可重复性
为了保证研究的可信度和可重复性,数据集应该具有公开性和可重复性。可公开与重复使用的数据
应符合以下要求:
1、数据集的许可证:数据集的许可证应该明确规定数据集的使用方式和条件,以便其他人可以了
解数据集的使用限制和要求。
2、数据集的格式和文档:数据集应该提供详细的文档和说明,以便其他人可以了解数据集的结构
和内容。同时,数据集应该以标准格式或常见格式进行发布,以便其他人可以方便地使用和处
理数据。
3、数据集的访问和下载:数据集应该提供公开的访问和下载方式,以便其他人可以方便地获取数
据集。同时,数据集的下载应该是可重复的,以便其他人可以在相同的条件下重复实验和验证
结果。
4、数据集的更新和维护:数据集应该定期进行更新和维护,以便保持数据集的完整性和准确性。
同时,数据集的更新应该具有可追溯性,以便其他人可以了解数据集的变化和更新内容。
8 应用丰富度
8.1 类型完备度
文本图像篡改检测应符合以下要求:
1、应完全支持拍照、文档、截屏三种文本图像获取方式;
2、每种文本图像类型建议支持五种以上文本图像篡改检测,如证件照,建议至少支持身份证、港澳通
行证、护照、驾照和营业执照的文本图像篡改检测。
3、建议至少支持两种以上语言的文本图像篡改检测。
9 系统成熟度
9.1 易用性
文本图像检测系统应支持以下需求:
1、无代码操作:用户无需操作代码,仅需在Web页面或端侧上交互以完成文本图像篡改检测相关
工作;
T/ISC 0058—2024
10
2、可视化面板:系统应支持结果可视化,处理状态可视化。将处理进度、检测结果显示在Web页
面或移动端;
3、文档输出:系统可支持将检测结果以图片或文本信息方式导出。
9.2 安全性
文本图像检测系统应满足以下要求:
1、隐私保护:确保篡改检测系统对于用户隐私信息的保护,不泄露或滥用用户上传的图像和数据。
用户在上传图像前,应当被告知其数据将如何使用并获得用户的知情同意。系统应提供详细的
知情同意书,明确说明数据的收集、处理和存储方式,以及用户的权利和数据安全保障措施。
2、鲁棒性:系统应具备对不同图像质量和不同攻击类型的鲁棒性,以确保在各种条件下都能进行
准确的篡改检测。不同攻击类型包括:缩放、压缩、软件传输等。
3、可信度评估:系统应能够对检测结果进行可信度评估,判断检测结果的准确性和可靠性。
4、对抗性防御:针对对抗性攻击,系统应具备相应的防御机制,能够有效识别和抵御对抗性篡改,
包括对抗训练、异常检测、模型增强等。
5、安全通信:确保图像传输和处理过程中的安全性,采用加密技术和安全通信协议,防止数据泄
露和中间人攻击,具体可参考安全通信标准EN50159。
6、跨平台兼容性:系统应支持在不同平台上进行图像篡改检测,包括PC、移动设备和云端等,保
证跨平台的兼容性和一致性。
7、审计与日志记录:系统应记录用户操作、图像处理过程和检测结果,以便进行安全审计和追踪。
8、用户认证和权限控制:确保只有授权用户才能访问和使用篡改检测系统,防止未经授权的访问
和操作。
10、更新与维护:及时更新系统,修复漏洞和错误,以保持系统的稳定性和安全性。
9.3 产品部署
1、安全性要求:确保在部署过程中和运行时能够保护用户数据和隐私。防止安全漏洞和攻击,包
括网络攻击、数据泄露等。
2、性能要求:在不同硬件平台和网络环境下应具有稳定的性能。对于计算密集型任务,需要优化
算法和硬件选择,以提高计算速度。根据不同应用场景,可选择单一文本图像检测类型,以确
保检测精度。
3、可伸缩性要求:应该能够在不同规模的用户量下保持良好的性能。考虑并发用户数、数据量等
因素,确保产品能够水平扩展。
T/ISC 0058—2024
11
4、硬件支持:应该能够在不同的硬件设备上运行,如CPU,GPU,Atlas服务器处理器等。
5、跨平台支持:应该能够在不同操作系统和设备上运行,如Windows、Linux、iOS、Android等。
确保在不同浏览器、手机型号等下都能正常展示和运行。
6、合规性要求:针对特定行业或地区的法规和规定,满足相应的合规性要求。
T/ISC 0058—2024
12
10 评价标准
10.1 评价指标
10.1.1 文本图像篡改分类指标
采用测评数据对检测系统进行测试,统计测评数据的TP、TN、FP、FN值:
1、TP:无篡改文本图像预测正确数量;
2、TN:篡改文本图像预测正确数量;
3、FP:无篡改文本图像预测错误数量;
4、FN:篡改文本图像预测错误数量。
10.1.1.1 准确率(Accuracy)
在特定数据集中检测所有文本图像准确程度的测量指标,Acc指标计算如下:
?� =
? + ?
? + ? + ? + ?
× 100%
10.1.1.2 误检率(False Positive Rate)
在特定数据集中无篡改文本图像误检程度的测量指标,FPR指标计算如下:
?� =
?
? + ?
× 100%
10.1.1.3 召回率(Recall)
在特定数据集中检测篡改文本图像准确程度的测量指标,Recall指标计算如下:
?���� =
?
? + ?
× 100%
10.1.2 文本图像篡改定位指标
采用测评数据对检测系统进行测试,统计预测的篡改区域与实际篡改区域的IoU值(检测结果
和真值标注之间交集面积占并集面积的比例):
IoU =
A ∩ B
A ∪ B
式中:
A ——预测的篡改区域;
B ——实际的篡改区域;
然后计算mIoU:
mIoU =
1
N n=1
N
下载地址
T/ISC 0058-2024 文本图像篡改检测系统技术要求 标准封面