咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Hellinger距离的混合数据集中分类变量相似度分析 收藏

基于Hellinger距离的混合数据集中分类变量相似度分析

Hellinger Distance Based Similarity Analysis for Categorical Variables in Mixture Dataset

作     者:赵亮 刘建辉 王星 ZHAO Liang;LIU Jian-Hui;WANG Xing

作者机构:辽宁工程技术大学研究生学院阜新123000 辽宁工程技术大学电子与信息工程学院葫芦岛125000 

出 版 物:《计算机科学》 (Computer Science)

年 卷 期:2016年第43卷第6期

页      面:280-282,307页

学科分类:08[工学] 0812[工学-计算机科学与技术(可授工学、理学学位)] 081202[工学-计算机软件与理论] 

基  金:国家自然科学基金项目:语义Web模糊规则互换与推理关键技术研究(61402212)资助 

主  题:分类变量 相似度 f散度 Hellinger距离 

摘      要:分类变量的相似度分析是数据挖掘任务中的一个重要环节,现有的分类变量相似度算法中存在忽视变量差异、受不均衡分布影响严重、无法应用于混合数据集等缺点。为克服以上缺点,提出了一种基于Hellinger距离的分类变量相似度算法。该算法累加分类变量对应子集中不同属性变量的分布差异作为相似度,且支持混合数据集。将所提算法代入聚类算法并应用于UCI公共数据集,结果表明,该算法在准确度、有效性和稳定性上都有较大提高。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分