ILRD:一种融合IPC_LDA和文本语义特征的专利推荐模型
作者机构:湖北工业大学计算机学院 中南财经政法大学信息工程学院
出 版 物:《情报杂志》 (Journal of Intelligence)
年 卷 期:2024年
核心收录:
学科分类:1205[管理学-图书情报与档案管理] 12[管理学] 120501[管理学-图书馆学] 081203[工学-计算机应用技术] 08[工学] 120502[管理学-情报学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家社会科学基金一般项目“人工智能时代新闻推荐系统中的‘信息茧房’问题形成机理及解决策略研究”(编号:21BXW076)阶段性研究成果
主 题:专利推荐 IPC LDA主题建模 预训练模型 RoBERTa DPCNN 半导体
摘 要:[研究目的]随着全球专利数量的持续增长,现有的专利推荐模型难以精准地理解专利文本中复杂的语义信息,忽视了专利的领域和主题信息,从而影响专利的准确推荐。因此,实现一个能够综合考虑多种因素的高效专利推荐模型具有重要意义。[研究方法]本研究提出了一种ILRD专利推荐模型,通过IPC语义结构化映射与LDA主题建模来表征专利的技术领域和核心主题。构建RoBERTa与DPCNN模型深入解析专利文本的复杂语义,以实现多因素融合的专利推荐。[研究结果/结论]实证研究显示,ILRD模型在半导体领域的专利推荐上,其准确率和F1得分显著超越常规模型,推荐准确率提高至86%。验证了本文方法的有效性,也为跨领域专利推荐提供了新思路。