求解多模概率分布Gamma混合模型的半EM算法
作者机构:深圳大学计算机与软件学院 人工智能与数字经济广东省实验室(深圳)
出 版 物:《计算机应用》 (Journal of Computer Applications)
年 卷 期:2024年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:广东省基础与应用基础研究基金粤深联合基金重点项目(2023B1515120020) 广东省自然科学基金面上项目(2023A1515011667) 深圳市科技重大专项项目(202302D074) 深圳市基础研究面上项目(JCYJ20210324093609026)
主 题:多模概率密度函数 Gamma混合模型 期望最大化算法 聚类 对数似然函数
摘 要:期望最大化(EM)算法在混合模型参数估计中发挥着重要作用,但现有的EM算法在求解Gamma混合模型(GaMM)参数时存在局限性,主要体现在因近似计算导致低质量的参数估计,以及由于大量数值计算造成的计算效率低下问题。为克服这些局限,并充分利用数据的多模性质,提出了一种半EM(Semi-EM)算法,以求解用于估计多模概率分布的GaMM。首先,该算法通过聚类探测数据的空间分布特性,用以初始化Ga MM参数,进而更准确地刻画数据的多模性。其次,在EM算法框架的基础上,对于缺乏封闭更新表达式而导致的参数更新困难问题,采用自定义的启发式策略对Ga MM形状参数进行更新,使其朝着最大化对数似然的方向逐步调整,同时以封闭形式更新其余参数。经过一系列具有说服力的实验,验证了所提出的Semi-EM算法的可行性、合理性和有效性。实验结果表明,Semi-EM算法在精确估计多模概率分布方面优于与之对比的四种算法,具体表现在Semi-EM算法具有更低的误差指标以及更高的对数似然值,表明该算法能够提供更准确的模型参数估计,从而更精确地刻画数据的多模性质。