基于自动编码器的句子语义特征提取及相似度计算
Semantic Feature Extraction and Similarity Computation of Sentences Based on Auto-encoder作者机构:河北工业大学计算机科学与软件学院天津300401
出 版 物:《郑州大学学报(理学版)》 (Journal of Zhengzhou University:Natural Science Edition)
年 卷 期:2018年第50卷第2期
页 面:86-91页
学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:自动编码器 无监督特征学习 语义特征提取 相似度计算
摘 要:句子特征提取与相似度计算是自然语言处理中的重要问题.目前汉语句子相似度计算方法不能全面考虑句子语义,因而导致相似度计算结果不够准确.提出了基于深层稀疏自动编码器的句子语义特征提取及相似度计算算法.首先将句子表示为高维、稀疏向量,进一步利用深度无监督学习句子非线性特征,即将高维、稀疏向量变换到低维、本质特征空间,此过程是一种更为纯粹的端到端的学习,避免了建立停用词表、分词等工作,最终得到可直接用于句子相似度计算的低维特征表示.实验结果表明,提取到的句子特征应用于句子相似度计算,与基于关系向量模型的句子相似度计算方法相比,提高了相似度计算准确率,计算的时间复杂度仅为O(n).