基于电子商务用户行为的同义词识别
Synonym Recognition Based on User Behaviors in E-commerce作者机构:哈尔滨工业大学黑龙江哈尔滨150001
出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)
年 卷 期:2012年第26卷第3期
页 面:79-85页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金资助项目(60975077 90924015)
主 题:同义词识别 用户行为 SimRank Gradient Boost Decision Tree
摘 要:该文研究了电子商务领域同义词的自动识别问题。电子商务领域的同义词是指对同一事物或概念的不同表达,即在商品描述和检索中可以相互替换的词,针对该领域新词多、错别字多、近义词多的特点,提出基于用户行为的同义词识别方法。首先通过并列关系符号切分商品标题和基于SimRank思想聚集查询两种方法获取候选集合,进而获取两词的字面特征以及标题、查询、点击等用户行为特征,然后借助Gradient Boost Decision Tree模型判断是否同义。实验表明同义词识别准确率达到56.52%。