咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于哈希学习的投票样例选择算法 收藏

基于哈希学习的投票样例选择算法

Voting instance selection algorithm based on learning to hash

作     者:黄雅婕 翟俊海 周翔 李艳 HUANG Yajie;ZHAI Junhai;ZHOU Xiang;LI Yan

作者机构:河北大学数学与信息科学学院河北保定071002 河北省机器学习与计算智能重点实验室(河北大学)河北保定071002 北京师范大学珠海校区应用数学与交叉科学研究中心广东珠海519087 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2022年第42卷第2期

页      面:389-394页

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:河北省科技计划项目重点研发专项(19210310D) 河北省自然科学基金资助项目(F2018201096) 河北大学研究生创新资助项目(hbu2019ss077) 

主  题:样例选择 哈希学习 海明距离 矢量量化 投票方法 

摘      要:随着数据的海量型增长,如何存储并利用数据成为目前学术研究和工业应用等方面的热门问题。样例选择是解决此类问题的方法之一,它在原始数据中依据既定规则选出代表性的样例,从而有效地降低后续工作的难度。基于此,提出一种基于哈希学习的投票样例选择算法。首先通过主成分分析(PCA)方法将高维数据映射到低维空间;然后利用k-means算法结合矢量量化方法进行迭代运算,并将数据用聚类中心的哈希码表示;接着将分类后的数据按比例进行随机选择,在多次独立运行算法后投票选择出最终的样例。与压缩近邻(CNN)算法和大数据线性复杂度样例选择算法LSH-IS-F相比,所提算法在压缩比方面平均提升了19%。所提算法思想简单容易实现,能够通过调节参数自主控制压缩比。在7个数据集上的实验结果显示所提算法在测试精度相似的情况下在压缩比和运行时间方面较随机哈希有较大优势。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分