基于LSI的日地空间领域科学数据语义检索模型
LSI-based semantic retrieval model for scientific data in solar-terrestrial space field作者机构:中国科学院国家空间科学中心北京100190 中国科学院大学北京100049
出 版 物:《中国科学院大学学报(中英文)》 (Journal of University of Chinese Academy of Sciences)
年 卷 期:2016年第33卷第5期
页 面:711-719页
核心收录:
学科分类:0810[工学-信息与通信工程] 08[工学] 080401[工学-精密仪器及机械] 0804[工学-仪器科学与技术] 080402[工学-测试计量技术及仪器] 0835[工学-软件工程] 0825[工学-航空宇航科学与技术] 081002[工学-信号与信息处理]
基 金:中国科学院信息化建设专项(XXH12504-08) 中国科学院战略性先导科技专项(XDA04080000)资助
摘 要:日地空间系统科学的数据具有体量大、种类多、结构复杂的特征,不同概念、不同事件之间的相互关联为该领域内的科学数据检索提出了很高的要求.然而目前该领域内依然以基于传统的关键词检索技术为主,严重影响检索结果的质量.提出一种数据语义检索模型,它是在对日地空间学科元信息提取的基础上,使用文本处理的方法将提取信息转换为词项-文档矩阵,进一步使用潜在语义索引技术对其进行分析,计算出检索条目与不同数据集的语义相关度,从而根据语义相关度向用户推荐科学数据.实验对比表明,该模型的召回率明显优于传统方法,且具有很高的准确率.该模型同时支持对科学数据进行语义标注和关键词提取,亦可用于其他领域科学数据检索.