基于.NET的专利信息管理系统的设计与实现
作者单位:中国海洋大学
学位级别:硕士
导师姓名:韩雷
授予年度:2012年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
摘 要:专利信息是重要的竞争情报资源,它蕴含着丰富的技术知识。充分挖掘和利用专利信息,有助于技术人员发现新的技术领域和技术手段,对于企业寻找新的经济增长点、判断行业发展方向,制定发展战略具有重大的意义。然而现在专利数量大,增长速度快,依靠人工手段寻找并分析有用专利信息难度很大。 国外已经出现了很多与专利信息采集及分析相关的软件,但大多数只关注英文专利。国内对专利信息的研究起步较晚。本文以我国大陆地区专利为研究对象,研究专利信息的采集及分析技术,设计开发了基于.NET的专利信息管理系统。 本文要采集的专利信息来自于国家知识产权局网站的专利数据库。针对该网站的特点,设计开发了专利信息采集模块。专利信息采集模块根据用户输入的检索条件,向网站数据库发送请求。首先获取该检索条件查询结果页面的源代码,然后根据此源代码使用正则匹配的方法解析出各专利页面的地址,再根据此地址向数据库发送请求,获取专利详细信息页面的源代码,使用正则匹配的方法解析出专利的基本信息和说明书下载地址,最后根据说明书下载地址下载说明书。 本文的专利信息分析分为基本统计分析和专利聚类两部分。基本统计分析以中国海洋大学申请的专利为研究对象,包括申请人分析、发明人分析和代理机构分析。通过统计专利的基本信息,反映申请人的年度申请量、年度授权量和专利类别分布,和年度发明人数、发明人申请量、发明人专利权重以及代理机构代理量和区域分布等情况,从而获取申请人的专利申请规律和科研技术实力。本系统的专利聚类包括快速聚类和综合聚类两种,本文中以快速聚类为例进行阐述。快速聚类以中国海洋大学2011年申请的发明专利为研究对象。对这些专利的名称和摘要信息进行处理后,使用K-MEDOIDS聚类算法对专利文本进行聚类。用户可以自己设定K值进行聚类,同时,本文提供了根据加权的类间类内相似度比率来获取最佳的K值的方法,帮助用户选择最合适的K值。 本文提出了一种计算发明人专利权重的方法,是对专利发明人分析的一种创新。本系统设计过程中充分考虑了功能的全面性、实用性和快捷性,并且操作简单、界面友好。本系统应用前景广阔,特别是对单个申请人专利状况的分析,具有很高的实用价值。