咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >不一致数据最大概率子集修复算法 收藏

不一致数据最大概率子集修复算法

Maximum probability subset repair algorithm for inconsistent data

作     者:夏秀峰 司佳宇 张安珍 XIA Xiu-feng;SI Jiayu;ZHANG An-zhen

作者机构:沈阳航空航天大学计算机学院沈阳110136 

出 版 物:《沈阳航空航天大学学报》 (Journal of Shenyang Aerospace University)

年 卷 期:2023年第40卷第1期

页      面:48-57页

学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(项目编号:62102271) 

主  题:不一致数据 最大概率 子集修复 数据清洗 机器学习 

摘      要:针对关系型数据中的不一致错误,现有子集修复方法通常以最小删除元组数量为优化目标求解最优修复方案,以减少对原始数据的更改。但当数据中的错误较多时,该方法的准确率将降低。提出了一种最大概率子集修复方法,利用属性之间的关联关系及概率统计信息对元组的正确性概率进行建模,将最小删除元组的正确性概率之和作为优化目标进行最优子集修复,并给出了高效的最大概率子集修复近似算法。真实数据集和合成数据集上的实验结果表明,最大概率子集修复方法的准确率优于当前最好方法。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分