短文本先验模型判定技术研究与实践
The research and practice of a prior model decision technique for short text作者机构:中国移动通信有限公司研究院北京100053 中国移动集团公司信息安全管理与运行中心北京100053
出 版 物:《电信工程技术与标准化》 (Telecom Engineering Technics and Standardization)
年 卷 期:2017年第30卷第10期
页 面:33-38页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:中国移动集团级一类科技创新成果 原成果名称为《基于大数据算法的信息安全管控工具与平台研发(莫扰)》
主 题:违规信息过滤 先验模型 文字特征 关键词模式 内容特征
摘 要:为了应对违规信息的快速、多样化发展,运营商对违规信息的治理手段也需要与时俱进,需要对违规信息的覆盖更全面、判定更精准。基于以上目标,本文提出了一种基于先验模型的短文本违规信息识别与过滤方法。该方法从文字特征层、关键词模式层、内容特征层3个层面对于违规信息进行分析,最后利用综合分析判定层结合之前的训练对短信进行最终的判定。我们在保证较高违规信息判定准确率的前提下,可以大幅度提高违规信息判定的召回率,较好的解决目前违规信息判定问题,为运营商节省大量人力。