咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于特征学习的校园场景识别与定位 收藏
基于特征学习的校园场景识别与定位

基于特征学习的校园场景识别与定位

作     者:UMURUNGI Sandra Nicole 

作者单位:北京交通大学 

学位级别:硕士

导师姓名:金一

授予年度:2020年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:学习特征 提取特征 场景识别 场景分类 

摘      要:计算机视觉是一门跨学科的科学领域,涉及计算机如何从数字图像中获得高级理解。从工程学的角度来看,它试图理解人类视觉系统可以完成的任务并通过编程的方式实现。计算机视觉任务包括用于获取、处理、分析、理解数字图像和提取可产生数字或符号形式的决策信息的高维数据的方法。场景识别是机器人和计算机视觉应用的基本问题,而学习特征是计算机视觉的一个重要技术,它是允许系统从原始数据中自动发现特征检测或分类所需的表示形式的技术。本研究的校园场景识别和定位的基本特征学习是属于图像定位领域的,对图像中的物体进行定位、摄像机拍摄的场景图像的定位与识别又是计算机视觉领域的一项任务,也是解决识别问题的第一步。现有的研究说明了场景识别和分类定位的重要性。本文采取了五种不同的行为方式,如鼓掌,拳击,挥手,投掷和步行。使用HOG&SIFT等特征检测技术,并在支持向量机上训练,最终给出了准确的结果。基于图像定位的目的是从单一的查询图像中检索出感兴趣区域内摄像机的姿态(方位和位置),并显示出可识别的目标位置,本研究的目标是通过使用摄像机拍摄各个建筑物不同角度的照片,来对这些位置进行定位。本文使用了一种对图像预处理的方法,目的是去除不必要的信息,帮助模型有效地学习图像的特征,从而提高了精度。本文还介绍了图像预处理的几种方法,包括调整图像大小、创建图像像素阵列和数据采集、去除图像中的背景噪声。特征提取对正确检测目标具有重要作用,本文提出了一种基于兴趣的局部特征提取方法用于检测图像中的关键点,该方法通过计算该点周围区域的方向梯度(HOG)直方图,并用尺度不变特征变换(SIFT)提取特征,该变换包括四个主要阶段:尺度空间的极值检测、特征点定位、特征方向赋值和特征点描述。为了评价本研究提出方法的性能,使用一组新的测试图像预测其类别,并给出位置预测的准确性。将支持向量机(SVM)算法用于特征提取后的图像分类。支持向量机是一组用于分类的监督式学习方法,适用于广义线性分类。支持向量机的特点是,它能同时最小化经验分类误差和最大化几何边缘区,因此支持向量机(SVM)被称为最大边缘区分类器。支持向量机将输入向量映射到一个高维特征空间,在该空间中构造一个最大分离超平面,在分离超平面的每一侧构造两个平行超平面,分离超平面是使两个平行超平面之间的距离最大化的超平面。这些平行超平面之间的差距或距离越大,则说明分类器的泛化误差就越小,论文的最后在对常见评估指标进行了比较的基础上,我们将混淆矩阵用于评估本研究提出方法的性能。混淆矩阵是一个表格,通常用于描述一个分类模型在一组已知真实值的测试数据上的性能。它允许可视化算法的性能,并显示分类模型在进行预测时被混淆的部分。本研究首先介绍了所使用的数据集,并对数据集进行了预处理,然后对数据进行提取特征,最后将每幅图像对应的特征组合成不同类别的分类图像用于场景识别。由于定义场景识别是计算机视觉的一项里程碑式的任务,因此可以定义用于对象识别的上下文。该方法同时利用图像的全局特征描述符、局部特征描述符以及对应于每个图像的描述符,从每幅图像中提取与检测到的关键点相对应的尺度不变特征变换(SIFT)特征。本研究主要利用sklimage库(scikit图像)进行特征提取。对应于图像中的每个关键点,都存在一个尺度不变的特征变换描述符,其尺寸由参数步长(描述符采样点之间的距离)和半径(描述扫描区域的尺寸)控制。本研究还提取了一个与不同粒度的整个图像相对应的标准方向梯度(HOG)描述子直方图(利用像素/单元、单元/块和方向的参数),该直方图允许我们选择不同尺度的特征。实验采用标准支持向量机(SVM)分类器进行场景识别。我们利用sckit-learn(sklearn)库来实现支持向量机,通过将数据集随机分成训练集和测试集来进行交叉验证,并从划分的训练集中构造训练特征向量。最后我们通过得到的总体准确性、混淆矩阵以及标准信息检索数据,如精确率、召回率和F值来评价本研究提出的方法的性能。我们收集了北京交通大学收集的数据,将各个建筑的地标作为该地点的标志位置,在每组中构建了53组用于场景识别的建筑地标图像,其中包含了该建筑地标在不同角度的更多图像。然后将用于场景识别的数据集分为两类(训练和测试),通过随机选择训练集和测试集,得到了特、场景识别和定位技术上的实验结果。最后我们可以在数据集中检索图像进行场景匹配,并分析了实例级地标匹配对场景识别等影响定位精度的因素。在本研究的实验中使用python编写来实现特征提取和分类器模型。实验实现了从所有训练图像中提取的尺度不变特征变换(SIFT)描述子。在单用尺度不变特征变换(SIFT)描述子时,分类准确率为76%,平均准确率为76%,平均召回率为75%,平均F1分数为71%。在只使用方向梯度直方图(HOG)时的分类准确率为56%,平均准确率为61%,

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分