面向新闻领域的用户行为捕获系统设计与实现
作者单位:北京邮电大学
学位级别:硕士
导师姓名:孟祥武
授予年度:2010年
学科分类:08[工学] 080402[工学-测试计量技术及仪器] 0804[工学-仪器科学与技术]
摘 要:随着Web信息的爆炸性增长,如何快速、准确地从浩瀚的信息资源中寻找到所需信息已经成为困扰人们的一大难题。搜索引擎技术虽然满足了人们一定的需要,但由于其通用的性质,仍然不能满足不同背景、不同目的和不同时期的用户个性化的需求。用户行为捕获就是针对这个问题而提出来的。用户行为捕获的研究目标在于充分利用获取到的用户的个性化信息,通过用户兴趣制导或与用户交互等灵活手段来向用户提供用户所需信息,更充分利用网络信息,以更好地服务于用户的个性化需求。用户行为的采集与分析,无论是对Web站点的可用性设计,或是对用户个性化模型构建,都有着十分重要的意义。 本论文中实现的系统是面向新闻领域的自动推荐原型系统的一个子系统,即面向新闻领域的用户行为捕获系统,其中系统的需求分析和系统设计是与小组其他成员共同讨论完成,系统的实现与测试自己独立完成。本系统主要是以新闻领域为背景,设计并实现一个基于J2EE的新闻原型系统,根据用户初次使用系统时注册的个人信息,定制用户描述文件。并采用隐式的方式捕获用户的网上浏览、检索等行为信息,将捕获到的信息经过处理后映射成用户对不同新闻分类的兴趣值,来不断更新和维护用户的个性化模型。 另一方面,本论文针对当前搜索引擎技术所存在的问题,为了更好的捕获用户的检索行为,引入了本体和语义Web技术,对本体描述语言、构建方法、构建工具、语义推理等进行深入的分析和研究。此外,通过建立面向新闻领域的本体模型,实现了对基于Protege的本体建模、基于Jena API的语义查询和基于Racer的逻辑推理,并在此基础上,实现通过本体与搜索技术的有机结合,提高用户检索的查准率和查全率。