数据开采的数据质量问题
Research on Data Quality for Data Mining作者机构:东南大学经管学院南京210096 合肥工业大学合肥230009
出 版 物:《管理工程学报》 (Journal of Industrial Engineering and Engineering Management)
年 卷 期:2002年第16卷第1期
页 面:21-29页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:江苏省自然科学基金资助项目 ( 76 0 5 730 0 72 )
主 题:数据开采 数据质量 数据仓库 统计学 机器学习 数据挖掘 评价指标
摘 要:数据质量是影响数据开采效果的重要因素 ,这个问题并未受到人们的充分重视。本文针对数据质量在数据开采中的地位 ,给出了数据质量评价的几个主要尺度。并且结合统计学和机器学习的理论 ,分析了解决数据质量的方法 ,强调提高数据质量的出发点在于控制数据源的质量。