一种面向不确定标签样本的K-近邻高效决策算法
An Efficient K-Nearest Neighbor Decision Algorithm for Samples with Uncertain Labels作者机构:上海交通大学计算机科学与工程系上海200240 上海海勃物流软件有限公司上海200080
出 版 物:《应用科学学报》 (Journal of Applied Sciences)
年 卷 期:2020年第38卷第5期
页 面:659-671页
学科分类:0810[工学-信息与通信工程] 0808[工学-电气工程] 08[工学] 0805[工学-材料科学与工程(可授工学、理学学位)] 0814[工学-土木工程] 0701[理学-数学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点研发计划项目(No.2019YFB1704405)资助。
主 题:K-近邻算法 标签不确定性 边界树算法 计算速度优化
摘 要:基于案例的决策是一种直接依据过去的历史案例对当前案例进行分类或者指标预测的方法,K-近邻方法就是一种广泛应用的基于案例的决策模型。在K-近邻方法中,历史案例上需要有标签,而在现实应用中,标签本身有一定的不确定性.文章详细地讨论了现有的基于K-近邻的决策方法忽略了样本标签不确定性这一问题,并基于Dempster-Shafer证据理论对标签不确定性进行建模以改善预测的性能,在此基础上结合边界树模型提高模型的运行效率.文中介绍了边界树算法的作用与原理,对如何结合传统边界树算法与样本标签的不确定性对边界树算法的节点转移策略以及决策过程进行了优化.文章最后对边界树算法的计算规模与准确率做了详细的实验论证.结果表明,文中提出的方法一方面考虑了标签的不确定性,另一方面提高了传统的K-近邻模型的决策效率.