一种基于文本语义的网络敏感话题识别方法
A text semantics-based detection method for Internet sensitive topics作者机构:西安交通大学智能网络与网络安全教育部重点实验室机械制造系统工程国家重点实验室西安710049
出 版 物:《深圳信息职业技术学院学报》 (Journal of Shenzhen Institute of Information Technology)
年 卷 期:2011年第9卷第3期
页 面:33-37页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金资助项目(60921003 60802056 60905018) 国家"863计划"资助项目(2007AA01Z480) 国家科技支撑计划资助项目(2011BAK08B02)
摘 要:网络已成为当今世界重要的信息载体,但是网络信息良莠不齐,对人们的生活造成了很多负面影响,因此,如何正确识别网络中的敏感话题,是当前网络舆情分析与监管的重要任务之一。本文以识别网络论坛中的敏感话题为目标,基于网络论坛文本在结构和表达上表现出的篇幅短、结构不完整、文字口语化等特性,将该类文本表示成基于向量空间模型的文本矩阵,并根据网络敏感话题具有先验知识和态度倾向性等特点,提出了基于倾向性词典的特征提取方法,可有效提高网络敏感话题识别的正确率,最后通过实验验证了这一改进的有效性,证实了本文的研究价值。