中文文本抄袭检查技术的研究
Research on the Chinese Text Plagiarism Checker作者机构:浙江工商大学信息与电子工程学院浙江杭州310018
出 版 物:《杭州电子科技大学学报(自然科学版)》 (Journal of Hangzhou Dianzi University:Natural Sciences)
年 卷 期:2010年第30卷第5期
页 面:117-120页
学科分类:0809[工学-电子科学与技术(可授工学、理学学位)] 08[工学]
基 金:浙江省科技计划重点资助项目(C31066) 浙江工商大学校级学生创新重点资助项目(1120XJ1709198)
摘 要:该文介绍了一种基于字符串匹配的中文文本抄袭检测方法——k-grams算法,并指出了选取常用语句降低了其判别的准确性。提出了利用基于统计的中文分词技术实现对k-grams算法的改良。实验结果表明改良后的算法判断抄袭的准确性得到了提高。