基于ERNIE_STC模型的企业科技需求与科研人员匹配研究
作者单位:河南师范大学
学位级别:硕士
导师姓名:刘行兵
授予年度:2023年
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:企业科技需求 Sentence-BERT 行业与学科类目映射 ERNIE_STC模型 数字化匹配平台
摘 要:产学研合作是企业、高校和科研机构之间的紧密合作关系,可以促进科技成果的转化和应用,提升创新能力和技术水平,实现科技创新与产业升级的良性循环。但是,如何将企业科技需求转化为科研问题并为企业成功推荐合适的科研人员一直以来都是一个研究难题。为解决这一问题,本文采用基于预训练语言模型Sentence-BERT的方法,建立了《国民经济行业分类》和《学科分类与代码》的映射关系,以便将企业科技需求转化为科研问题。此外,本文还提出了基于ERNIE_STC模型对企业需求文本进行处理并与科研人员进行匹配的方法,为企业推荐合适的科研人员。最后,本文结合研究成果,设计并开发了产学研协同数字化平台。该平台能够为企业精准推荐符合科技需求的科研人员,提升了产学研合作的便捷性和高效性。本文主要研究内容如下:(1)基于Sentence-BERT的行业分类与学科类目映射研究。企业与科研人员所处两个不同行业,且有不同的分类标准。为了快速满足企业的科技需求,需要建立两个领域分类标准的映射,以便能够准确地将企业的需求与相应的科研人员或团队匹配。为了解决这个问题,本章采用了基于预训练语言模型Sentence-BERT的方法,建立了行业与学科类目之间的映射关系。首先,使用BERT模型训练了两种分类法中类目的文本描述。其次,利用Sentence-BERT中的孪生网络共享类目权重和文本描述特性,抽象出两种分类法中类目的描述文本,并计算得到它们之间的维度向量。最后,通过余弦相似度模型计算双方类目间的相似度得分,从而实现类目的映射。通过人工标注的数据集进行5折交叉实验验证,结果表明该方法平均准确率达到88.14%,Top-3准确率达到91%。为企业科技需求被科研人员及时响应提供了基础数据模型支撑。(2)基于ERNIE_STC模型的科研人员推荐研究。针对企业无法精准且快速找到科研人员的问题,本研究提出了基于ERNIE_STC模型的企业科技需求和科研人员推荐方法。首先,将ERNIE_STC模型对国内需求平台上的数据集进行分词处理,将每个词进行词向量编码。其次,对分词完成后的数据进行词向量编码,将其转换为维度向量。利用Transformer编码器对词向量序列进行处理,提高对需求文本的精准处理。最后,计算处理好的企业需求文本与科研人员研究方向、近期研究热点和研究成果的相似度,为企业精准推荐科研人员。实验表明,使用ERNIE_STC处理企业科技需求效果最佳,5折交叉实验的平均准确率达到91.75%,能够精确处理企业需求,为企业推荐合适的科研人员。(3)产学研协同合作在线匹配平台设计与实现。为了解决企业在寻找符合其科技创新需求的科研人员时面临的困难,本研究设计并实现了一个产学研协同合作在线匹配平台,该平台的整体框架和系统结构进行了详细的分析。平台采用了Python编程语言和Flask框架,将系统划分为项目管理、用户信息管理、审核和系统反馈等主要模块。平台将前文提出的方法进行了集成和优化,针对企业发布的科技需求进行处理,为企业推荐精准符合需求的科研人员。通过该平台,企业可以方便地寻找和与优秀的科研人员开展合作,提高科技创新效率和质量。