基于双向递归神经网络的轨迹数据修复
作者单位:山东大学
学位级别:硕士
导师姓名:刘洋
授予年度:2018年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:轨迹数据 修复 BRNN TensorFlow
摘 要:在智慧城市建设浪潮中,有许多与监控和基于位置相关的应用,例如交通流量监控、下一位置预测、热门线路推荐等。这些应用需要获取移动实体的地理位置信息,并跟踪他们的运动轨迹。而随着技术的不断发展,诸如视频监视系统、GPS、智能手机等设备的普及使得我们轻而易举便可获取到海量的移动实体轨迹数据。然而,在自然条件下,由于存在环境因素的干扰,导致得到的移动实体原始轨迹数据质量往往不高,而低质量的数据将会严重降低上述实际应用的效果。因此,需要采用合理的技术手段修复轨迹数据,提升轨迹数据质量。针对轨迹数据修复问题,已有的研究成果中主要有地图匹配、基于路网规则、基于历史数据等方法。轨迹数据的一大特点是其具备时空序列性,而目前的研究成果中,地图匹配和基于路网规则的方法只利用了轨迹数据的空间序列性而忽略了其时间序列性。因此,针对因移动实体ID识别错误和轨迹记录获取失败而导致的轨迹数据中存在非法轨迹记录和轨迹记录缺失这两个问题,本文采取合理、有效的方法予以解决。首先,本文提出了一种有效的数据补全方法,该方法包含两个步骤:1)充分利用因移动实体ID识别错误而产生的脏数据,根据移动实体ID编辑距离、时间限制条件及移动实体速度限制条件,修复部分缺失值;2)在轨迹集合中查找相似轨迹,利用相似轨迹相互补全特性,进一步修复部分缺失值。然后,利用word2vec将卡口向量化,以更好的发掘、利用卡口之间的内在关系。最后,选取在处理时序数据方面取得巨大成功的Bidirectional Recurrent Neural Network(BRNN)模型,将卡口向量作为BRNN模型输入,完成最终的轨迹修复。我们在人工智能学习系统TensorFlow上实现了 word2vec和BRNN模型,并且使用真实的交通数据集进行了大量的实验。实验结果充分说明了本模型在解决轨迹数据修复问题时的有效性和先进性。