中文问答系统中时间敏感问句的识别和检索
Recognition and Retrieval of Time-sensitive Question in Chinese QA System作者机构:哈尔滨工业大学深圳研究生院网络环境智能计算重点实验室广东深圳518055
出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)
年 卷 期:2013年第50卷第12期
页 面:2612-2620页
核心收录:
学科分类:0810[工学-信息与通信工程] 0808[工学-电气工程] 08[工学] 081104[工学-模式识别与智能系统] 081203[工学-计算机应用技术] 0839[工学-网络空间安全] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金面上项目(61272383 61173075)
主 题:时间敏感问句 时间解析 问句分类 问句检索 问答系统
摘 要:当前问答系统如百度知道、SoSo问问等在问句检索时没有考虑时效性要求,对时间敏感问句不能返回满足时效要求的结果.针对该问题,设计了时间敏感问句的识别和检索方法:首先依据时效要求对问句进行分类,识别出时间敏感问句,然后解析时间敏感问句的时效区间,最后根据解析结果对问句检索结果进行过滤,得到满足时效要求的结果.问句分类采用词法、句法和语义等特征,使用决策树、朴素贝叶斯、SVM等机器学习方法进行测试.问句的时效区间使用构造的时间域表达式计算获得.实验表明,使用C5.0决策树进行时间敏感问句的识别准确率达到0.901;与未考虑时间敏感问题的系统相比,时间敏感问句检索结果平均精度得到较大改善.