引入位置信息和Attention机制的诈骗电话文本分类
Position Embedding and Attention are Introduced into the Fraudulent Phone Text Classification作者机构:山东建筑大学信息与电气工程学院济南250000 山东建筑大学山东省智能建筑技术重点实验室济南250000
出 版 物:《小型微型计算机系统》 (Journal of Chinese Computer Systems)
年 卷 期:2023年第44卷第11期
页 面:2502-2509页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:山东省重大科技创新工程项目(2019JZZY010120)资助 山东省重点研发计划项目(2019GSF111054)资助
主 题:诈骗电话文本分类 双向门控循环神经网络 卷积神经网络 位置编码 Attention
摘 要:诈骗电话案件频频发生并威胁着人们的生活,含有诈骗语义的语句与内容的前后文、语句序列、局部相关内容以及显著关键词语相关.本文提出神经网络模型PEAGCNN(Position Embedding and Attention are introduced into BiGRU and CNN)对诈骗电话文本分类.首先构建相关数据集,词嵌入用于表示文本,不同频率的正弦、余弦函数对文本位置信息编码并融入词嵌入向量,然后分别利用BiGRU(Bidirectional Gated Recurrent Unit)和CNN(Convolutional Neural Network)提取文本上下文相关信息、语句序列以及局部相关性,Attention机制对提取出的信息重新分配权重,突出关键信息的作用,最后将两种信息融合,通过Softmax实现分类.在THUCNews数据集以及诈骗电话文本数据集上的实验结果表明,本文提出模型的准确率和F1值均比对比模型有提升,同时模型对诈骗电话文本数据集分类的各项性能指标均在0.91以上.