基于Flink的k-支配skyline体并行求解算法
A k-dominant skyline body parallel solving algorithm based on Flink作者机构:大连民族大学计算机科学与工程学院辽宁大连116600 大数据应用技术国家民委重点实验室(大连民族大学)辽宁大连116600 大连市民族文化数字技术重点实验室(大连民族大学)辽宁大连116600
出 版 物:《计算机工程与科学》 (Computer Engineering & Science)
年 卷 期:2023年第45卷第1期
页 面:17-27页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
主 题:k-支配 skyline查询 多用户 Apache Flink 并行查询
摘 要:k-支配skyline算法弱化了数据点之间的支配关系,更适合高维数据。k-支配skyline体适应于多名用户使用k-支配skyline算法查询,而现有的求解算法在时间效率和代码扩展性方面都有待提高。因此,提出了面向多用户的k-支配skyline体求解优化算法MKSSOA,该算法对每名用户的候选集和中间集分别进行存储,同时在k-支配检查过程中利用2集合中数据点出现的先后次序将候选集中的非k-支配skyline点存储到对应用户的中间集中,以便下一名用户筛选使用,这样可以减少数据点之间的比较次数,避免重复计算,从而提升查询效率。同时,提出了面向多用户的k-支配skyline体并行求解算法MKSPSA,通过Apache Flink并行处理框架有效减少了数据点的比较时间。理论研究和实验结果显示,提出的算法具有较高的效率,能很好地处理多用户k-支配skyline问题。