基于GPU的文本分类算法研究-南通市图书馆

文献详情 >基于GPU的文本分类算法研究收藏

基于GPU的文本分类算法研究

作者：韩敬涛

作者单位：东北大学

学位级别：硕士

导师姓名：常桂然

授予年度：2010年

学科分类：081203[工学-计算机应用技术] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0812[工学-计算机科学与技术（可授工学、理学学位）]

主题：文本分类图形处理器 CUDA架构 KNN算法 SVM算法

摘要：随着信息技术的普及和发展,互联网上的网页数量呈指数级增长。人们要想在短时间内准确的得到自己想要的信息,就要预先对互联网信息就行分类整理。由于网页中的信息大部分是文本信息,所以文本分类技术逐渐成为信息领域的一个十分重要的研究课题。文本分类技术就是将一些杂乱无章的文本,根据其内容自动地将其分到预先定义的一个或者几个类别的过程。文本分类算法中得到最广泛应用的是KNN （K-Nearest Neighbor）算法和SVM （Support Vector Machine）算法。虽然之前有一些学者对其进行了改进,使得分类的效率有所提高,但是由于算法本身的原因,二者分类的计算复杂度仍然很高。随着CUDA架构的出现和发展,基于图形处理器（GPU）的高性能通用计算技术日益成熟。为了弥补KNN与SVM文本分类算法高计算量的缺点,本文开展了在GPU上实现的文本分类算法的研究。具体工作如下：首先,将KNN算法在CPU上进行了实现;然后,基于GPU上对KNN算法的文本相似度的计算和排序进行了改进;最后,通过了解LIBSVM工具的分类原理,对SVM算法的文本训练算法SMO （Sequential Minimal Optimization）使用GPU并行计算加速。通过实验证明,本文中的算法可以使得KNN与SVM文本分类算法在保证分类质量的基础上提高了分类效率。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

FontfaceFontSizeBoldItalicUnderlineBackColorAlignListLinkImgEmot

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于GPU的文本分类算法研究

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于GPU的文本分类算法研究

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：