咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于半结构化文本信息抽取的简历识别系统 收藏
基于半结构化文本信息抽取的简历识别系统

基于半结构化文本信息抽取的简历识别系统

作     者:陈川波 

作者单位:北京邮电大学 

学位级别:硕士

导师姓名:蔺志青

授予年度:2008年

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:半结构化文本   正则匹配 关联性 统计 分割 循环控制 

摘      要:在日常生活中,简历是一类常见文本。从功能上看,简历是其作者介绍自己,推销自己,最终达到有效沟通的重要手段;从行文结构上看,它是一种半结构化文本。该类文本应用广泛、数目众多,因此,高效、准确的实现其信息抽取成为一个迫切的需求。在本文中,将就如何实现简历信息抽取进行研究。 一方面,从信息抽取效率上看,人工读取显然已经不能满足现实需求,而必须要利用计算机相关技术;另一方面,从准确抽取的可行性上看,根据半结构化文本的特征和文本信息抽取技术,如正则表达式匹配、关联性分析、统计等方法可以使抽取结果满足实际需要,即实现机器智能化识别是可行的。 本文的主要研究对象是简历,主要任务是针对以简历文本为代表的半结构化文本进行信息抽取的研究工作,主要研究成果包括三个方面:第一,提出了一种可广泛应用于各类半结构化文本的信息抽取思路;第二,设计了一套切实可用的简历信息抽取算法;第三,实现了一个可用的简历识别系统。 从本文的内容结构上看,论文主要分为五章:首先,绪论介绍论文半结构化文本在实际情况中的应用、进行信息抽取研究的必要性及可行性和项目的主要成果;其次,在第二章中根据实际项目需求,阐述了半结构化文本的定义,描述了该类文本的特点,提出了实现有效信息抽取的方案;再次,在第三、四中具体介绍简历信息抽取系统。该系统描述主要包括两个方面:系统设计和算法研究。前者主要是从工程应用上对系统进行描述,后者则是从算法实现上阐述系统的运作原理;最后,在第五章中对本文所论述的内容进行总结。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分