基于文本挖掘的生物领域实例获取
Case Acquisition in Biological Domain Based on Text Mining作者机构:上海交通大学机械与动力工程学院上海200240
出 版 物:《上海交通大学学报》 (Journal of Shanghai Jiaotong University)
年 卷 期:2018年第52卷第8期
页 面:954-960页
核心收录:
学科分类:0710[理学-生物学] 07[理学] 081203[工学-计算机应用技术] 08[工学] 09[农学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金资助项目(51475288 51305260 51605302) 科技部创新方法专项(2015IM010100)
主 题:文本挖掘 向量空间模型 特征选择 生物激励设计 知识获取
摘 要:面向以自然语言描述的生物领域实例,基于自然语言的向量表示模型,研究与设计相关的生物领域实例获取问题,提出了基于文本挖掘的生物领域实例获取方法.通过对语料库文本向量空间的构建和知识挖掘,研究生物领域文本的特征选择、相似性度量和实例检索方法,为设计需求驱动的生物领域实例获取提供技术支持.实例分析表明:一方面,基于向量空间模型的生物领域文本挖掘方法在精度和召回率两方面均较基线法具有较大的优势;另一方面,基于向量空间的文本检索机制具有很好的适应性和扩展性,可以满足不同环境下语义检索的需要.