基于Lucene的地名数据库快速检索系统
Place name database quick searching system based on Lucene作者机构:华中师范大学国家文化产业研究中心武汉430079
出 版 物:《计算机应用研究》 (Application Research of Computers)
年 卷 期:2017年第34卷第6期
页 面:1756-1761页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
基 金:国家科技支撑计划资助项目(2012BAH83F00)
主 题:Lucene 地名 全文检索 数据库 中文分词 相关度排序
摘 要:针对传统关系型数据库海量地名数据检索效率低下的问题,提出了一种盘古分词和Lucene全文检索相结合的地名数据库快速检索方法。首先,设计了一种地名数据表结构,比较了几种常用开源分词器的中文分词性能,并选用性能优异的盘古中文分词器,通过扩展其词典来实现中文地名的有效分词。其次,利用内存索引和多线程并行处理技术提高Lucene创建倒排索引效率,并依据地名类别和显示优先级属性优化了检索结果相关度排序策略。最后,开发了一套具有快速搜索和地图定位展示的Web地名检索系统,使用500万条真实地名数据测试了其检索性能,查询平均耗时不到1s,比MySQL数据库模糊检索效率提高了15倍,匹配结果也更加准确,能够提供高效灵活的海量地名公共检索服务。