基于同义词词林的评分在中医案例自测系统中的应用
作者单位:西北大学
学位级别:硕士
导师姓名:申卫昌
授予年度:2013年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:主观题评分是自然语言处理中的一个重要研究领域。目前,人们对主观题的批改还处于人工评阅的阶段,老师在阅卷时不可避免会受到一些外在因素的影响,比如老师对知识的掌握情况、批阅时的心情等,所得到的分数不能很客观的表现学生的个人能力。随着网络的发展,人工智能等技术的出现,人们迫切希望计算机能够代替老师来处理主观题阅卷工作,以消除人为因素造成的不公平情况,并且减少老师的工作负担。那么,如何让计算机准确客观的对主观题进行阅卷是人们目前所面临的一个挑战。 本文主要采用语义相似度来解决中医案例自测系统中的主观题评分功能。首先介绍了主观题评分的研究现状,流程及相关技术,在计算中文分词时,使用了中科院的ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)中文分词系统,说明了相似度是主观题评分的关键。然后研究了词语的相似度,重点提出了新的基于《同义词词林》的相似度算法,并和《知网》进行比较。同时,在此基础上,通过对本文所面向的对象的分析,实现了基于语义和基于词形词序相融合的语句相似度方法。最后,将优化的相似度算法应用于主观题评分领域,并实现了针对中医案例分析的一个实用系统。通过对基于同义词词林的方法与基于知网的算法进行对比,并和其他几种方法的实验分析,证明本文实现的基于语义的相似度方法能够快速进行反馈并具有较高的准确率。