咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >社交媒体中基于用户生成内容轨迹发现和轨迹补充的研究 收藏
社交媒体中基于用户生成内容轨迹发现和轨迹补充的研究

社交媒体中基于用户生成内容轨迹发现和轨迹补充的研究

作     者:陈昭男 

作者单位:深圳大学 

学位级别:硕士

导师姓名:李霞

授予年度:2020年

学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:树索引 轨迹发现 位置识别 轨迹补充 循环神经网络 用户生成内容 

摘      要:用户在社交媒体中发布的信息中可能携带着位置信息,对于不包含准确经纬度定位信息的内容,可对其分析时间和空间维度以获得用户位置的跟踪。传统的轨迹探测方法其主要缺陷在于,在检测非标准用户内容时,它对于轨迹识别的模糊内容的容错能力以及识别精度均较低;此外,对于能记录携带经纬度信息的轨迹位置信息的场景,往往由于设备的续航问题使得轨迹的补充必不可少。本文的主要的研究内容包括:1)提出基于树索引的用户轨迹发现方法。本文提出一个全局的位置识别方法,能够处理用户生成内容(如微博等)包含的位置信息,使用多条用户生成信息的位置标识不仅可以探测用户潜在感兴趣的位置,而且还可以补齐用户生成信息的位置数据。论文在两种公开数据集上对比了本算法的原始版本和优化版本,分别在用户生成内容UGC(User Generated Contents)最优位置和用户最优位置的准确率上有小幅提升,在召回率上有较大提升。与两种现有算法对比,基于树索引的方法在F-值与效率上均有较大提高。本工作的主要创新点在于:加入位置模糊处理,能纠正当前其他主流方法的位置错误信息;采用树结构匹配,能利用全部的用户生成内容中的位置信息,提高召回率;采用剪枝和链表存储,以空间换时间,提高算法效率,并大幅提升数据规模增大时的稳定性。2)提出基于循环神经网络的编解码机制的轨迹补充算法TCED(Trajectory Completion Encoder and Decoder)。该算法通过无监督的自动编码机获得轨迹的编码方式,继而通过端对端的模型结构学习兴趣点的特征。模型获得轨迹的起始点和终点及轨迹的长度,输出轨迹的起始点和终点之间的轨迹补充。为提高性能,该模型融入注意力机制以获得对轨迹输入片段中影响更大的兴趣点的重视。此外,模型引入集束搜索的思想以获得更优的效率,并使用重构器缓解轨迹补充过程中搜索结果的次优问题,与主流轨迹补充算法相比验证其有效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分