文本作者身份识别研究综述
Review on Text Authorship Identification作者机构:大连外国语大学计算机教研部大连116044 大连外国语大学英语学院大连116044 中国大连高级经理学院大连116024
出 版 物:《图书情报工作》 (Library and Information Service)
年 卷 期:2015年第59卷第16期
页 面:143-148页
核心收录:
学科分类:12[管理学] 1205[管理学-图书情报与档案管理] 08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家社会科学基金一般项目"典籍英译国外读者网上评论观点挖掘研究"(项目编号:15BYY028) 教育部人文社会科学研究规划青年基金项目"基于多层面特征分析的在线信息作者身份识别研究"(项目编号:11YJCZH131)研究成果之一
摘 要:[目的/意义]鉴于传统的作者身份识别方法不适用于当前大量涌现的网络文本。综述近年文本作者身份识别的典型方法和关键问题,并进行客观分析和评价,以期为进一步研究提供新的思路。[方法 /过程]分别从应用领域、文体特征选取、作者身份建模和性能评价指标等方面对国内外作者身份识别相关研究现状进行客观分析,梳理相关领域研究发展脉络和趋势。[结果/结论]作者身份识别需要适应短文本、不规范文本、海量、高维和多语种环境,需更具表现和刻画能力的多层面特征和相应的作者身份建模方法,并借助信息检索、机器学习和自然语言处理领域的最新研究成果提高效率和准确率。