未命名概念的发现及其在类比推理中的应用
作者单位:河南大学
学位级别:硕士
导师姓名:韩道军
授予年度:2017年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:随着互联网技术的迅速发展和快速应用,以及信息技术的大爆炸,人们需要处理的信息数据也在日益增长。在这些信息数据中,包含着众多的概念——未命名概念和已被人类认知的命名概念。而如何从海量的信息数据中检索到未命名概念的信息,以及利用未命名概念推出更完备的知识,成为许多学者一直研究的问题。研究学者在类比推理的过程中发现,在运用类比推理方法进行知识学习的应用中通常存在以下问题:(1)在传统的类比推理方法中,源领域的知识只包含了命名概念,并以命名概念为基础,类比推理得到靶领域的知识。然而,在知识的自动学习过程中,大规模数据中往往存在许多尚未被人类认知的“准概念——未命名概念(即它们的内涵和外延可以被计算出来,但却未被人类命名)。(2)现有的类比推理方法中,缺乏对未命名概念的利用。随着源领域知识的增加,知识的管理和检索的开销也将快速上升,急需建立一种恰当的利用未命名概念进行推理的方法,来发现更完整的类比推理结果。针对以上类比推理过程中出现的两个问题,本文将研究重点放在如何寻找未命名概念,并利用未命名概念类比推理得到源领域与靶领域之间的知识映射。主要研究内容为:(1)利用概念格理论,建立某领域本体和该领域的概念格模型。对于已构建好的概念格模型,首先对该领域中的每个属性和本体中的概念进行匹配,将其中不能和本体中的概念匹配成功的概念添加到未命名概念集合。其次对两个概念进行语义计算,若计算出的语义值低于领域专家规定的特定阈值,则将该领域概念添加到未命名概念集合。(2)针对现有类比推理模型中不能很好利用未命名概念这一问题,观察到概念格模型表达的信息具有完备性,能够将所有概念信息一一表达的特点,本文提出一种基于未命名概念的类比推理算法。首先建立源领域和靶向领域的概念格模型,通过概念格结构把源领域和靶向领域中的数据(属性)有机地组织起来,将数据(属性)之间的关系通过概念格节点之间的例化和泛化关系表达,其次利用同构算法得到两个领域之间的映射关系,最后利用未命名概念将源领域中的映射关系类比至靶领域,从而提高类比推理的效果。