基于本体的语义检索研究
作者单位:曲阜师范大学
学位级别:硕士
导师姓名:崔新春
授予年度:2010年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:传统信息检索主要是基于关键词,将用户的检索请求和全文中的每一个词进行比较,由于字义本身与其概念的延伸不在同一级上,这使得查询结果仅仅是与字面意义或某层意义相匹配,不能准确理解用户查询意图,导致查全率和查准率不高。本体具有良好的概念层次结构和对逻辑推理的支持,能够通过概念之间的关系表达概念的语义信息。因此,基于本体的语义检索能够理解用户的查询意图,并挖掘出语义信息,从而检索出与此概念相关的、用户需求的信息,在语义层次上实现检索,克服了传统信息检索技术的局限性。 本文首先介绍了基于本体的语义检索研究的国内外现状。然后,提出了“语义信息链的概念,重点阐述了其中的语义检索如何体现语义信息来实现语义层次上的检索。本文的主要研究内容如下: (1)基于本体的语义检索的优势——体现语义信息,提出了“语义信息链的概念,语义信息链包括本体构建、语义索引和语义检索三个环节,语义检索环节是其关键环节。 (2)介绍了体现语义信息的语义检索的基本过程包括查询式扩展和对结果排序。语义信息链中的语义检索首先利用本体库中的语义信息,扩展得到与查询整体语义相关的概念。本文从用户输入模式出发介绍了查询扩展的基本思路,并提出了相应的算法。 (3)提出了一种语义检索算法。语义信息链中的语义检索通过查询扩展得到扩展概念,然后与被检索内容中的语义信息相匹配,通过计算查询概念和文档的相似度,将符合用户需求的结果排在前面供用户查阅。在此基础上,提出了语义检索算法。 (4)对算法进行验证和分析。以“C++程序设计双语课程领域本体库为基础建立系统,实现了简单的语义检索功能,以此来验证本文所提出的检索算法的有效性。 本文对基于本体的语义检索作了系统的研究。提出了语义扩展算法和检索算法并进行了有效性验证。如何在语义检索过程中更深层次地体现语义信息,以及完善检索算法是我们今后工作的目标。