咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于知识图谱的专利知识检索研究 收藏
基于知识图谱的专利知识检索研究

基于知识图谱的专利知识检索研究

作     者:马国斌 

作者单位:哈尔滨工业大学 

学位级别:硕士

导师姓名:钟诗胜

授予年度:2021年

学科分类:12[管理学] 1205[管理学-图书情报与档案管理] 08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:知识图谱 知识抽取 向量化表示 专利检索 

摘      要:专利作为最能体现人类发明创造能力的知识载体,对制造企业的发展也起着至关重要的推动作用,一方面企业可以通过申请专利来保护自己的知识产权,另一方面企业通过对专利中所含知识的合理利用也能促进其自身的创新进程。随着人工智能技术的飞速发展,以及我国制造企业对其所拥有的知识进行智能化管理需求的增长,将二者结合起来对知识进行有效的管理和挖掘分析有着广阔的应用前景,目前,制造企业知识管理还没有将诸如自然语言处理等前沿的深度学习技术应用到知识的挖掘分析场景中,导致了知识的利用效率不高的问题。针对上述现状,本文尝试将知识图谱相关技术应用到制造企业所拥有的典型知识——专利文本的检索中,开展如下研究工作。为了将专利从文档细化为更小的结构化知识粒度以便于精细化的知识管理与应用,进行专利知识图谱构建研究。以机械制造企业所拥有的与发动机相关的专利文本作为数据来源,对专利知识图谱的本体层进行较为完善的定义;研究基于Bert的深度学习算法,对专利文本中的实体和实体之间的关系进行自动化抽取,利用客观标注的专利数据集验证算法,证明专利知识抽取的准确度。最后,利用抽取出来的知识构建专利知识图谱,实现专利的结构化建模。为了对构建起来的专利知识图谱进行可计算性处理,支持知识图谱的数字化应用效率,研究知识图谱向量化表示技术。分析现有TransE算法,针对其对术语实体表达能力不足的问题,提出融合词汇信息和实体类别信息的WTBT算法,用链接预测任务方法验证所提出算法的通用有效性,确保通用评价指标有一定的提升。利用较为直观的向量距离计算、向量可视化等方法,查找相似术语实体,最终验证本文算法所得向量对术语词汇具有有效语义表达能力。为改善现有专利检索系统单一的文本匹配模式,无法对输入的检索语句进行有机的扩展、限制了专利重用效率的问题,将检索语句的模式分类为包含单个实体或包含多个实体的情况,详细分析每种模式的检索意图,提出基于知识图谱的专利扩展检索模型(PEBKG),针对不同检索模式,给出对应的扩展检索方案,并采用检索实例验证本文模型的有效性。本文的研究内容为专利文本的知识挖掘方法提供了一种新的思路,利用知识图谱这种图形结构化方法对专利文本进行解构,支持具有联想特性的智能检索需求,具有一定的创新性。在专利知识图谱的构建和应用方面也有一定的实用和借鉴意义。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分