基于OCR识别模型的视频内敏感信息处理
作者单位:重庆工商大学
学位级别:硕士
导师姓名:李季
授予年度:2023年
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
摘 要:随着网络技术的发展,人类社会步入电子化时代,视频成为人们保存、传递信息的重要工具。人们在通过视频获取、分享各种信息的同时,一些敏感信息也随着视频得到传播,给社会的安全带来了极大的危害。相对于单纯以图片、文字为载体的敏感信息传递方式,视频类载体信息传递的检测、拦截显得更为困难。本文旨在检测视频中的文本类敏感信息并对其进行覆盖处理,防止相关敏感信息的传递。相较于现有文献中单独研究文字识别或者敏感信息检测,本文基于研究目的,将文字识别和敏感信息检测结合,在文字识别的基础上对视频内敏感信息进行实际处理。本文实验以网络视频为研究对象,包含若干个1分钟左右的短视频与几小时的长视频,对其进行识别-分类-处理。主要研究内容包括:使用PP-OCR对视频图像进行文字识别,在图像拍摄角度过于倾斜、距离较远、光线较强或过暗的情况下,该方法的文字识别效果均会受到影响。因此为减小这些干扰因素的影响,本文在PP-OCR识别前,对样本图像加入灰度处理、去噪、剪切等预处理过程。以此增强图像文本特征,减小识别误差,进而更完整地获取PP-OCR的识别文本。基于文本识别结果,利用朴素贝叶斯进行文本分类,进而提取敏感视频。由于分类过程中传统分词方法会对文本中所有类型的字词都进行切割,结果造成了耗时长且工作量大等问题。基于此,本文利用敏感数据库进行文本分词,仅切割敏感字词,能有效减少分类器测试集词条数量、缩短程序运行时间。针对敏感视频图像,利用Open CV+局部定位关键词进行信息加密处理,对敏感视频内敏感信息进行覆盖。实验结果显示,利用CTW数据集测试改进的PP-OCR模型识别效果,模型识别准确率由60%提升到88%,提升了28%。利用敏感数据库进行大量样本数据的文本分词后,分类模型样本量减少、运行时间明显缩短,运行速度平均提升了11.52%。同时模型对敏感类图像的检测效果较好,模型分类准确率、召回率达到97%以上,最终信息覆盖也取得较好的效果。