贝叶斯网络中不确定性知识推理算法及其应用研究
作者单位:华南理工大学
学位级别:硕士
导师姓名:傅红卓
授予年度:2010年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:贝叶斯网络 朴素贝叶斯分类器 遗传算法 联合树 惰性传播
摘 要:在日常的生活中,人们要处理大量的不确定性问题。贝叶斯网络是表达不确定性问题的有效工具,它一方面采用有向图直观地表达事件之间的因果关系,另一方面采用贝叶斯统计理论对事件发生的可能性大小进行计算。本文对贝叶斯网络分类器和推理算法中存在的一些问题做了深入的研究工作,主要的工作如下: (1)对贝叶斯网络理论做了系统的分析和论述,归纳出贝叶斯网络与其他数据挖掘方法相比的特点。按照研究方法和思想的不同,重点对贝叶斯网络学习进行了总结,指出了各种方法的优点和不足之处。 (2)朴素贝叶斯分类器以其简洁明了的结构和优良的性能得到了广泛的研究,但是由于其要求属性间的条件独立性,在应用上受到限制。本文提出了一种把属性选择和结构扩展相结合的GA-NBC-TAN算法,相对于相同个数的特征属性的朴素贝叶斯分类器,GA-NBC-TAN算法提高了分类精度。 (3)贝叶斯网络推理是BN面向应用首先要解决的问题,然而贝叶斯网络的精确推理和近似推理都是NP难问题,联合树算法是贝叶斯网络中常用且有效地精确推理算法,但是由于其转换的不唯一性,寻求最优的联合树也被证实是一个NP难问题。本文提出了改进自适应遗传算法(AGA)来解决贝叶斯网络三角化过程中节点删除顺序问题,从而寻求最优的联合树结构。通过与标准遗传算法比较,AGA-Triangulation算法表现出较好的性能。在上面工作的基础上,最后本文论述了使用最优联合树结构的LAZY-ARVE方法,并与LAZY-AR方法做了比较,该方法可以解决一般查询和带有证据的查询问题。