高维类别属性数据流离群点快速检测算法
A Fast Outlier Detection Algorithm for High Dimensional Categorical Data Streams作者机构:东南大学计算机科学与工程系江苏南京210096
出 版 物:《软件学报》 (Journal of Software)
年 卷 期:2007年第18卷第4期
页 面:933-942页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 081202[工学-计算机软件与理论]
基 金:SupportedbytheNationalNaturalScienceFoundationofChinaunderGrantNo.70371015(国家自然科学基金) theDoctorScienceResearchFoundationoftheEducationMinistryofChinaunderGrantNo.20040286009(国家教育部高等学校博士学科点科研基金)
摘 要:提出类别属性数据流数据离群度量——加权频繁模式离群因子(weighted frequent pattern outlier factor,简称WFPOF),并在此基础上给出一种快速数据流离群点检测算法FODFP-Stream(fast outlier detection for high dimensional categorical data streams based on frequent pattern).该算法通过动态发现和维护频繁模式来计算离群度,能够有效地处理高维类别属性数据流,并可进一步扩展到数值属性和混合属性数据流.对仿真数据集和真实数据集的实验检测均验证该算法具有良好的适用性和有效性.